Add `atomic_ref` support for 8 and 16b types. #2255

wmaxey · 2024-08-17T00:11:50Z

Description

This enables the atomic_ref APIs to begin accepting 8 and 16b types. These types are emulated by 32 bit wide CAS loops.

Performance is terrible and program correctness is based entirely on whether the surrounding memory is valid and atomically accessed.

closes #2051

Checklist

New or existing tests cover these changes.
The documentation is up to date with these changes.

…ms to be invalid though

github-actions · 2024-08-17T05:47:54Z

🟩 CI finished in 4h 38m: Pass: 100%/417 | Total: 3d 08h | Avg: 11m 37s | Max: 1h 16m | Hits: 79%/34092

🟩 cub: Pass: 100%/131 | Total: 1d 04h | Avg: 12m 54s | Max: 1h 16m | Hits: 98%/4278

🟩 cpu
  🟩 amd64              Pass: 100%/123 | Total:  1d 02h | Avg: 13m 03s | Max:  1h 16m | Hits:  98%/4278  
  🟩 arm64              Pass: 100%/8   | Total:  1h 23m | Avg: 10m 26s | Max: 54m 22s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 14s | Max: 12m 14s | Hits:  99%/713   
  🟩 11.8               Pass: 100%/3   | Total: 14m 35s | Avg:  4m 51s | Max:  5m 27s
  🟩 12.5               Pass: 100%/113 | Total:  1d 02h | Avg: 14m 15s | Max:  1h 16m | Hits:  98%/3565  
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 10s | Avg:  3m 35s | Max:  3m 40s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 14s | Max: 12m 14s | Hits:  99%/713   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 35s | Avg:  4m 51s | Max:  5m 27s
  🟩 nvcc12.5           Pass: 100%/111 | Total:  1d 02h | Avg: 14m 27s | Max:  1h 16m | Hits:  98%/3565  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 10s | Avg:  3m 35s | Max:  3m 40s
  🟩 nvcc               Pass: 100%/129 | Total:  1d 04h | Avg: 13m 02s | Max:  1h 16m | Hits:  98%/4278  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 56s | Avg:  4m 29s | Max:  5m 16s
  🟩 Clang10            Pass: 100%/3   | Total: 16m 34s | Avg:  5m 31s | Max:  5m 42s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 43s | Avg:  4m 25s | Max:  4m 49s
  🟩 Clang12            Pass: 100%/4   | Total: 17m 53s | Avg:  4m 28s | Max:  4m 40s
  🟩 Clang13            Pass: 100%/4   | Total: 17m 28s | Avg:  4m 22s | Max:  4m 37s
  🟩 Clang14            Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 29s
  🟩 Clang15            Pass: 100%/4   | Total: 17m 57s | Avg:  4m 29s | Max:  4m 47s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 10s | Avg:  4m 32s | Max:  5m 08s
  🟩 Clang17            Pass: 100%/26  | Total:  6h 35m | Avg: 15m 11s | Max: 29m 29s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 52s | Avg:  3m 56s | Max:  4m 19s
  🟩 GCC7               Pass: 100%/6   | Total: 23m 09s | Avg:  3m 51s | Max:  4m 37s
  🟩 GCC8               Pass: 100%/6   | Total: 23m 26s | Avg:  3m 54s | Max:  4m 21s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 50s | Avg:  4m 08s | Max:  4m 27s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 06s | Avg:  4m 31s | Max:  4m 42s
  🟩 GCC11              Pass: 100%/7   | Total: 31m 45s | Avg:  4m 32s | Max:  5m 27s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 28s | Avg:  4m 37s | Max:  5m 07s
  🟩 GCC13              Pass: 100%/28  | Total:  9h 52m | Avg: 21m 10s | Max:  1h 16m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 46m | Avg: 55m 26s | Max: 57m 39s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 12m 14s | Avg: 12m 14s | Max: 12m 14s | Hits:  99%/713   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 31m | Avg: 45m 56s | Max: 48m 34s | Hits:  98%/1426  
  🟩 MSVC14.39          Pass: 100%/3   | Total:  2h 13m | Avg: 44m 31s | Max: 45m 56s | Hits:  98%/2139  
🟩 cxx_family
  🟩 Clang              Pass: 100%/59  | Total:  9h 05m | Avg:  9m 14s | Max: 29m 29s
  🟩 GCC                Pass: 100%/63  | Total: 12h 20m | Avg: 11m 45s | Max:  1h 16m
  🟩 Intel              Pass: 100%/3   | Total:  2h 46m | Avg: 55m 26s | Max: 57m 39s
  🟩 MSVC               Pass: 100%/6   | Total:  3h 57m | Avg: 39m 36s | Max: 48m 34s | Hits:  98%/4278  
🟩 gpu
  🟩 v100               Pass: 100%/131 | Total:  1d 04h | Avg: 12m 54s | Max:  1h 16m | Hits:  98%/4278  
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total: 14h 03m | Avg:  8m 31s | Max: 57m 39s | Hits:  98%/4278  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  3h 01m | Avg: 22m 37s | Max: 38m 22s
  🟩 GraphCapture       Pass: 100%/8   | Total:  3h 27m | Avg: 25m 57s | Max:  1h 16m
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 57m | Avg: 22m 08s | Max: 27m 39s
  🟩 TestGPU            Pass: 100%/8   | Total:  4h 40m | Avg: 35m 02s | Max: 54m 21s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 35s | Avg:  4m 51s | Max:  5m 27s
  🟩 90a                Pass: 100%/4   | Total: 14m 28s | Avg:  3m 37s | Max:  3m 48s
🟩 std
  🟩 11                 Pass: 100%/34  | Total:  6h 55m | Avg: 12m 12s | Max:  1h 16m
  🟩 14                 Pass: 100%/37  | Total:  8h 03m | Avg: 13m 03s | Max: 57m 39s | Hits:  98%/2139  
  🟩 17                 Pass: 100%/36  | Total:  7h 41m | Avg: 12m 49s | Max: 54m 21s | Hits:  98%/1426  
  🟩 20                 Pass: 100%/24  | Total:  5h 30m | Avg: 13m 46s | Max: 45m 56s | Hits:  98%/713

🟩 thrust: Pass: 100%/118 | Total: 13h 17m | Avg: 6m 45s | Max: 35m 45s | Hits: 97%/13005

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 12h 47m | Avg:  6m 58s | Max: 35m 45s | Hits:  97%/13005 
  🟩 arm64              Pass: 100%/8   | Total: 30m 00s | Avg:  3m 45s | Max:  4m 23s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 15s | Max: 15m 16s | Hits:  99%/1445  
  🟩 11.8               Pass: 100%/3   | Total: 12m 12s | Avg:  4m 04s | Max:  4m 23s
  🟩 12.5               Pass: 100%/100 | Total: 12h 01m | Avg:  7m 13s | Max: 35m 45s | Hits:  97%/11560 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 50s | Avg:  3m 55s | Max:  3m 56s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 15s | Max: 15m 16s | Hits:  99%/1445  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 12m 12s | Avg:  4m 04s | Max:  4m 23s
  🟩 nvcc12.5           Pass: 100%/98  | Total: 11h 54m | Avg:  7m 17s | Max: 35m 45s | Hits:  97%/11560 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 50s | Avg:  3m 55s | Max:  3m 56s
  🟩 nvcc               Pass: 100%/116 | Total: 13h 10m | Avg:  6m 48s | Max: 35m 45s | Hits:  97%/13005 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 33s | Avg:  4m 25s | Max:  5m 36s
  🟩 Clang10            Pass: 100%/3   | Total: 14m 18s | Avg:  4m 46s | Max:  4m 53s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 10s | Avg:  4m 17s | Max:  4m 21s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 06s | Avg:  4m 01s | Max:  4m 19s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 20s | Avg:  4m 05s | Max:  4m 17s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 44s | Avg:  4m 11s | Max:  4m 43s
  🟩 Clang15            Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  4m 22s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 30s | Avg:  4m 07s | Max:  4m 17s
  🟩 Clang17            Pass: 100%/18  | Total:  2h 03m | Avg:  6m 50s | Max: 17m 15s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 33s
  🟩 GCC7               Pass: 100%/6   | Total: 43m 38s | Avg:  7m 16s | Max: 25m 26s
  🟩 GCC8               Pass: 100%/6   | Total: 21m 14s | Avg:  3m 32s | Max:  3m 56s
  🟩 GCC9               Pass: 100%/6   | Total: 22m 08s | Avg:  3m 41s | Max:  4m 17s
  🟩 GCC10              Pass: 100%/4   | Total: 16m 40s | Avg:  4m 10s | Max:  4m 18s
  🟩 GCC11              Pass: 100%/7   | Total: 28m 52s | Avg:  4m 07s | Max:  4m 23s
  🟩 GCC12              Pass: 100%/4   | Total: 17m 47s | Avg:  4m 26s | Max:  4m 46s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 17m | Avg:  6m 51s | Max: 17m 11s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 39m | Avg: 33m 06s | Max: 35m 45s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 16s | Avg: 15m 16s | Max: 15m 16s | Hits:  99%/1445  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 51s | Avg: 11m 55s | Max: 12m 09s | Hits:  99%/2890  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 41m | Avg: 16m 56s | Max: 19m 36s | Hits:  97%/8670  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  4h 23m | Avg:  5m 10s | Max: 17m 15s
  🟩 GCC                Pass: 100%/55  | Total:  4h 54m | Avg:  5m 21s | Max: 25m 26s
  🟩 Intel              Pass: 100%/3   | Total:  1h 39m | Avg: 33m 06s | Max: 35m 45s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 20m | Avg: 15m 38s | Max: 19m 36s | Hits:  97%/13005 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 13h 17m | Avg:  6m 45s | Max: 35m 45s | Hits:  97%/13005 
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  9h 30m | Avg:  5m 45s | Max: 35m 45s | Hits:  97%/8670  
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 46m | Avg:  9m 42s | Max: 19m 36s | Hits:  99%/4335  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 00m | Avg: 15m 05s | Max: 17m 15s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 12m 12s | Avg:  4m 04s | Max:  4m 23s
  🟩 90a                Pass: 100%/4   | Total: 14m 17s | Avg:  3m 34s | Max:  3m 36s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  3h 11m | Avg:  6m 22s | Max: 29m 39s
  🟩 14                 Pass: 100%/34  | Total:  3h 57m | Avg:  6m 58s | Max: 33m 54s | Hits:  99%/5780  
  🟩 17                 Pass: 100%/33  | Total:  3h 47m | Avg:  6m 53s | Max: 35m 45s | Hits:  97%/4335  
  🟩 20                 Pass: 100%/21  | Total:  2h 21m | Avg:  6m 45s | Max: 17m 57s | Hits:  95%/2890

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 12h | Avg: 19m 34s | Max: 43m 46s | Hits: 61%/16707

🟩 cpu
  🟩 amd64              Pass: 100%/104 | Total:  1d 10h | Avg: 19m 56s | Max: 43m 46s | Hits:  61%/16707 
  🟩 arm64              Pass: 100%/8   | Total:  1h 57m | Avg: 14m 43s | Max: 18m 39s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  5h 42m | Avg: 22m 49s | Max: 43m 04s | Hits:  47%/2592  
  🟩 11.8               Pass: 100%/3   | Total: 58m 47s | Avg: 19m 35s | Max: 20m 56s
  🟩 12.5               Pass: 100%/94  | Total:  1d 05h | Avg: 19m 03s | Max: 43m 46s | Hits:  63%/14115 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total: 37m 05s | Avg: 18m 32s | Max: 19m 38s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  5h 42m | Avg: 22m 49s | Max: 43m 04s | Hits:  47%/2592  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 58m 47s | Avg: 19m 35s | Max: 20m 56s
  🟩 nvcc12.5           Pass: 100%/92  | Total:  1d 05h | Avg: 19m 03s | Max: 43m 46s | Hits:  63%/14115 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 37m 05s | Avg: 18m 32s | Max: 19m 38s
  🟩 nvcc               Pass: 100%/110 | Total:  1d 11h | Avg: 19m 35s | Max: 43m 46s | Hits:  61%/16707 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  2h 00m | Avg: 20m 02s | Max: 29m 24s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 00m | Avg: 20m 16s | Max: 21m 17s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 16m | Avg: 19m 08s | Max: 19m 50s
  🟩 Clang12            Pass: 100%/4   | Total:  1h 11m | Avg: 17m 50s | Max: 18m 59s
  🟩 Clang13            Pass: 100%/4   | Total:  1h 12m | Avg: 18m 11s | Max: 19m 50s
  🟩 Clang14            Pass: 100%/4   | Total:  1h 03m | Avg: 15m 52s | Max: 19m 38s
  🟩 Clang15            Pass: 100%/4   | Total:  1h 05m | Avg: 16m 29s | Max: 18m 41s
  🟩 Clang16            Pass: 100%/4   | Total:  1h 12m | Avg: 18m 11s | Max: 20m 00s
  🟩 Clang17            Pass: 100%/14  | Total:  4h 41m | Avg: 20m 08s | Max: 43m 46s
  🟩 GCC6               Pass: 100%/2   | Total: 53m 37s | Avg: 26m 48s | Max: 41m 28s
  🟩 GCC7               Pass: 100%/6   | Total:  2h 00m | Avg: 20m 09s | Max: 41m 39s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 58m | Avg: 19m 43s | Max: 43m 04s
  🟩 GCC9               Pass: 100%/6   | Total:  2h 02m | Avg: 20m 25s | Max: 41m 06s
  🟩 GCC10              Pass: 100%/4   | Total:  1h 15m | Avg: 18m 46s | Max: 20m 27s
  🟩 GCC11              Pass: 100%/7   | Total:  2h 05m | Avg: 17m 55s | Max: 20m 56s
  🟩 GCC12              Pass: 100%/4   | Total:  1h 13m | Avg: 18m 20s | Max: 19m 28s
  🟩 GCC13              Pass: 100%/21  | Total:  6h 46m | Avg: 19m 21s | Max: 41m 47s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 05m | Avg: 21m 52s | Max: 24m 17s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 26m 22s | Avg: 26m 22s | Max: 26m 22s | Hits:  47%/2592  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 56m 41s | Avg: 28m 20s | Max: 31m 05s | Hits:  44%/5546  
  🟩 MSVC14.39          Pass: 100%/3   | Total:  1h 01m | Avg: 20m 32s | Max: 33m 32s | Hits:  76%/8569  
🟩 cxx_family
  🟩 Clang              Pass: 100%/47  | Total: 14h 45m | Avg: 18m 50s | Max: 43m 46s
  🟩 GCC                Pass: 100%/56  | Total: 18h 15m | Avg: 19m 34s | Max: 43m 04s
  🟩 Intel              Pass: 100%/3   | Total:  1h 05m | Avg: 21m 52s | Max: 24m 17s
  🟩 MSVC               Pass: 100%/6   | Total:  2h 24m | Avg: 24m 06s | Max: 33m 32s | Hits:  61%/16707 
🟩 gpu
  🟩 v100               Pass: 100%/112 | Total:  1d 12h | Avg: 19m 34s | Max: 43m 46s | Hits:  61%/16707 
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  1d 06h | Avg: 18m 34s | Max: 43m 04s | Hits:  61%/16707 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 30m | Avg: 22m 32s | Max: 28m 38s
  🟩 Test               Pass: 100%/8   | Total:  4h 20m | Avg: 32m 33s | Max: 43m 46s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 58m 47s | Avg: 19m 35s | Max: 20m 56s
  🟩 90a                Pass: 100%/4   | Total: 40m 47s | Avg: 10m 11s | Max: 11m 11s
🟩 std
  🟩 11                 Pass: 100%/29  | Total: 11h 35m | Avg: 23m 59s | Max: 43m 46s
  🟩 14                 Pass: 100%/32  | Total:  9h 28m | Avg: 17m 45s | Max: 41m 24s | Hits:  64%/7978  
  🟩 17                 Pass: 100%/31  | Total:  9h 29m | Avg: 18m 22s | Max: 33m 49s | Hits:  66%/5706  
  🟩 20                 Pass: 100%/19  | Total:  5h 55m | Avg: 18m 43s | Max: 33m 32s | Hits:  43%/3023

🟩 cudax: Pass: 100%/55 | Total: 2h 36m | Avg: 2m 50s | Max: 6m 58s | Hits: 82%/102

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 29m | Avg:  2m 55s | Max:  6m 58s | Hits:  82%/102   
  🟩 arm64              Pass: 100%/4   | Total:  6m 58s | Avg:  1m 44s | Max:  1m 58s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 06m | Avg:  2m 52s | Max:  6m 16s | Hits:  82%/51    
  🟩 12.5               Pass: 100%/32  | Total:  1h 29m | Avg:  2m 48s | Max:  6m 58s | Hits:  82%/51    
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 06m | Avg:  2m 52s | Max:  6m 16s | Hits:  82%/51    
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 29m | Avg:  2m 48s | Max:  6m 58s | Hits:  82%/51    
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 36m | Avg:  2m 50s | Max:  6m 58s | Hits:  82%/102   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  5m 22s | Avg:  2m 41s | Max:  2m 52s
  🟩 Clang10            Pass: 100%/2   | Total:  5m 12s | Avg:  2m 36s | Max:  2m 47s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 34s | Avg:  2m 23s | Max:  2m 25s
  🟩 Clang12            Pass: 100%/4   | Total: 10m 25s | Avg:  2m 36s | Max:  3m 08s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 45s | Avg:  2m 26s | Max:  2m 32s
  🟩 Clang14            Pass: 100%/6   | Total: 18m 19s | Avg:  3m 03s | Max:  4m 33s
  🟩 Clang15            Pass: 100%/2   | Total:  5m 05s | Avg:  2m 32s | Max:  2m 38s
  🟩 Clang16            Pass: 100%/6   | Total: 18m 16s | Avg:  3m 02s | Max:  5m 07s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 22s | Avg:  2m 11s | Max:  2m 12s
  🟩 GCC10              Pass: 100%/4   | Total:  9m 17s | Avg:  2m 19s | Max:  2m 25s
  🟩 GCC11              Pass: 100%/4   | Total: 10m 17s | Avg:  2m 34s | Max:  2m 47s
  🟩 GCC12              Pass: 100%/12  | Total: 33m 49s | Avg:  2m 49s | Max:  5m 17s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  6m 16s | Avg:  6m 16s | Max:  6m 16s | Hits:  82%/51    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s | Hits:  82%/51    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 21m | Avg:  2m 43s | Max:  5m 07s
  🟩 GCC                Pass: 100%/22  | Total: 57m 45s | Avg:  2m 37s | Max:  5m 17s
  🟩 Intel              Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 MSVC               Pass: 100%/2   | Total: 13m 14s | Avg:  6m 37s | Max:  6m 58s | Hits:  82%/102   
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 36m | Avg:  2m 50s | Max:  6m 58s | Hits:  82%/102   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 01m | Avg:  2m 34s | Max:  6m 58s | Hits:  82%/102   
  🟩 Test               Pass: 100%/8   | Total: 34m 45s | Avg:  4m 20s | Max:  5m 17s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s
  🟩 90a                Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 21m | Avg:  2m 38s | Max:  5m 07s
  🟩 20                 Pass: 100%/24  | Total:  1h 14m | Avg:  3m 05s | Max:  6m 58s | Hits:  82%/102

🟩 pycuda: Pass: 100%/1 | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 417)

#	Runner
305	`linux-amd64-cpu16`
61	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

libcudacxx/codegen/generators/compare_and_swap.h

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h

github-actions · 2024-08-20T01:59:30Z

🟨 CI finished in 7h 41m: Pass: 98%/417 | Total: 2d 16h | Avg: 9m 13s | Max: 43m 42s | Hits: 97%/34092

🟨 thrust: Pass: 97%/118 | Total: 12h 20m | Avg: 6m 16s | Max: 35m 08s | Hits: 99%/13005

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  97%/110 | Total: 11h 49m | Avg:  6m 27s | Max: 35m 08s | Hits:  99%/13005 
  🟩 arm64              Pass: 100%/8   | Total: 30m 43s | Avg:  3m 50s | Max:  4m 54s
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 16m 33s | Hits:  99%/1445  
  🟩 11.8               Pass: 100%/3   | Total: 11m 57s | Avg:  3m 59s | Max:  4m 10s
  🔍 12.5               Pass:  97%/100 | Total: 11h 05m | Avg:  6m 39s | Max: 35m 08s | Hits:  99%/11560 
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 05s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 16m 33s | Hits:  99%/1445  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 11m 57s | Avg:  3m 59s | Max:  4m 10s
  🔍 nvcc12.5           Pass:  96%/98  | Total: 10h 57m | Avg:  6m 42s | Max: 35m 08s | Hits:  99%/11560 
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 05s
  🔍 nvcc               Pass:  97%/116 | Total: 12h 12m | Avg:  6m 18s | Max: 35m 08s | Hits:  99%/13005 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  96%/99  | Total:  7h 58m | Avg:  4m 49s | Max: 16m 33s | Hits:  99%/8670  
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 50m | Avg: 10m 03s | Max: 19m 18s | Hits:  99%/4335  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 31m | Avg: 18m 56s | Max: 35m 08s
🟨 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 25m 08s | Avg:  4m 11s | Max:  5m 14s
  🟩 Clang10            Pass: 100%/3   | Total: 13m 56s | Avg:  4m 38s | Max:  4m 50s
  🟩 Clang11            Pass: 100%/4   | Total: 16m 13s | Avg:  4m 03s | Max:  4m 35s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 23s | Avg:  4m 05s | Max:  4m 25s
  🟨 Clang13            Pass:  50%/4   | Total: 36m 21s | Avg:  9m 05s | Max: 14m 33s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 29s | Avg:  4m 07s | Max:  4m 20s
  🟩 Clang15            Pass: 100%/4   | Total: 16m 37s | Avg:  4m 09s | Max:  4m 25s
  🟩 Clang16            Pass: 100%/4   | Total: 17m 04s | Avg:  4m 16s | Max:  4m 24s
  🟩 Clang17            Pass: 100%/18  | Total:  1h 56m | Avg:  6m 29s | Max: 13m 49s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 24s | Avg:  3m 12s | Max:  3m 13s
  🟩 GCC7               Pass: 100%/6   | Total: 21m 39s | Avg:  3m 36s | Max:  4m 14s
  🟩 GCC8               Pass: 100%/6   | Total: 20m 59s | Avg:  3m 29s | Max:  3m 56s
  🟩 GCC9               Pass: 100%/6   | Total: 21m 55s | Avg:  3m 39s | Max:  4m 08s
  🟩 GCC10              Pass: 100%/4   | Total: 16m 02s | Avg:  4m 00s | Max:  4m 25s
  🟨 GCC11              Pass:  85%/7   | Total: 23m 45s | Avg:  3m 23s | Max:  4m 12s
  🟩 GCC12              Pass: 100%/4   | Total: 17m 55s | Avg:  4m 28s | Max:  5m 13s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 55m | Avg:  8m 47s | Max: 35m 08s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 14m 52s | Avg:  4m 57s | Max:  5m 13s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 33s | Avg: 16m 33s | Max: 16m 33s | Hits:  99%/1445  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 27m 39s | Avg: 13m 49s | Max: 14m 41s | Hits:  99%/2890  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 41m | Avg: 16m 57s | Max: 19m 18s | Hits:  99%/8670  
🟨 cxx_family
  🟨 Clang              Pass:  96%/51  | Total:  4h 34m | Avg:  5m 23s | Max: 14m 33s
  🟨 GCC                Pass:  98%/55  | Total:  5h 04m | Avg:  5m 32s | Max: 35m 08s
  🟩 Intel              Pass: 100%/3   | Total: 14m 52s | Avg:  4m 57s | Max:  5m 13s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 25m | Avg: 16m 12s | Max: 19m 18s | Hits:  99%/13005 
🟨 std
  🟩 11                 Pass: 100%/30  | Total:  2h 36m | Avg:  5m 13s | Max: 32m 57s
  🟩 14                 Pass: 100%/34  | Total:  3h 30m | Avg:  6m 11s | Max: 19m 18s | Hits:  99%/5780  
  🟨 17                 Pass:  96%/33  | Total:  3h 29m | Avg:  6m 20s | Max: 18m 52s | Hits:  99%/4335  
  🟨 20                 Pass:  90%/21  | Total:  2h 43m | Avg:  7m 47s | Max: 35m 08s | Hits:  99%/2890  
🟨 gpu
  🟨 v100               Pass:  97%/118 | Total: 12h 20m | Avg:  6m 16s | Max: 35m 08s | Hits:  99%/13005 
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 11m 57s | Avg:  3m 59s | Max:  4m 10s
  🟩 90a                Pass: 100%/4   | Total: 14m 12s | Avg:  3m 33s | Max:  3m 43s

🟨 libcudacxx: Pass: 97%/112 | Total: 1d 06h | Avg: 16m 22s | Max: 43m 42s | Hits: 96%/16707

🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  3h 36m | Avg: 14m 26s | Max: 43m 42s | Hits:  97%/2592  
  🟩 11.8               Pass: 100%/3   | Total:  1h 00m | Avg: 20m 14s | Max: 21m 06s
  🔍 12.5               Pass:  96%/94  | Total:  1d 01h | Avg: 16m 34s | Max: 31m 42s | Hits:  95%/14115 
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total: 37m 31s | Avg: 18m 45s | Max: 20m 13s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 36m | Avg: 14m 26s | Max: 43m 42s | Hits:  97%/2592  
  🟩 nvcc11.8           Pass: 100%/3   | Total:  1h 00m | Avg: 20m 14s | Max: 21m 06s
  🔍 nvcc12.5           Pass:  96%/92  | Total:  1d 01h | Avg: 16m 31s | Max: 31m 42s | Hits:  95%/14115 
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 37m 31s | Avg: 18m 45s | Max: 20m 13s
  🔍 nvcc               Pass:  97%/110 | Total:  1d 05h | Avg: 16m 20s | Max: 43m 42s | Hits:  96%/16707 
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/47  | Total: 12h 45m | Avg: 16m 16s | Max: 29m 39s
  🔍 GCC                Pass:  94%/56  | Total: 15h 23m | Avg: 16m 29s | Max: 43m 42s
  🟩 Intel              Pass: 100%/3   | Total: 53m 28s | Avg: 17m 49s | Max: 19m 59s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 32m | Avg: 15m 24s | Max: 20m 21s | Hits:  96%/16707 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  96%/99  | Total:  1d 01h | Avg: 15m 32s | Max: 43m 42s | Hits:  96%/16707 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 32m | Avg: 23m 03s | Max: 28m 07s
  🟩 Test               Pass: 100%/8   | Total:  3h 22m | Avg: 25m 18s | Max: 31m 42s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 56s | Avg:  1m 56s | Max:  1m 56s
🔍 sm: 90a 🔍
  🟩 60;70;80;90        Pass: 100%/3   | Total:  1h 00m | Avg: 20m 14s | Max: 21m 06s
  🔍 90a                Pass:  75%/4   | Total: 51m 46s | Avg: 12m 56s | Max: 22m 31s
🟨 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  1h 32m | Avg: 15m 28s | Max: 20m 25s
  🟩 Clang10            Pass: 100%/3   | Total: 46m 00s | Avg: 15m 20s | Max: 15m 40s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 05m | Avg: 16m 15s | Max: 19m 27s
  🟩 Clang12            Pass: 100%/4   | Total: 58m 31s | Avg: 14m 37s | Max: 14m 52s
  🟩 Clang13            Pass: 100%/4   | Total:  1h 03m | Avg: 15m 46s | Max: 17m 33s
  🟩 Clang14            Pass: 100%/4   | Total:  1h 01m | Avg: 15m 27s | Max: 18m 08s
  🟩 Clang15            Pass: 100%/4   | Total:  1h 02m | Avg: 15m 38s | Max: 17m 23s
  🟩 Clang16            Pass: 100%/4   | Total: 59m 08s | Avg: 14m 47s | Max: 15m 21s
  🟩 Clang17            Pass: 100%/14  | Total:  4h 16m | Avg: 18m 18s | Max: 29m 39s
  🟩 GCC6               Pass: 100%/2   | Total: 54m 37s | Avg: 27m 18s | Max: 43m 42s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 24m | Avg: 14m 08s | Max: 19m 28s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 21m | Avg: 13m 35s | Max: 17m 07s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 22m | Avg: 13m 49s | Max: 17m 09s
  🟩 GCC10              Pass: 100%/4   | Total:  1h 12m | Avg: 18m 10s | Max: 22m 44s
  🟩 GCC11              Pass: 100%/7   | Total:  2h 01m | Avg: 17m 25s | Max: 21m 06s
  🟨 GCC12              Pass:  75%/4   | Total:  1h 17m | Avg: 19m 19s | Max: 24m 22s
  🟨 GCC13              Pass:  90%/21  | Total:  5h 47m | Avg: 16m 33s | Max: 31m 42s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 53m 28s | Avg: 17m 49s | Max: 19m 59s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 17m 53s | Avg: 17m 53s | Max: 17m 53s | Hits:  97%/2592  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 32m 03s | Avg: 16m 01s | Max: 20m 21s | Hits:  92%/5546  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 42m 30s | Avg: 14m 10s | Max: 15m 00s | Hits:  97%/8569  
🟨 std
  🟨 11                 Pass:  96%/29  | Total:  8h 02m | Avg: 16m 38s | Max: 43m 42s
  🟨 14                 Pass:  93%/32  | Total:  8h 35m | Avg: 16m 06s | Max: 28m 41s | Hits:  97%/7978  
  🟩 17                 Pass: 100%/31  | Total:  8h 15m | Avg: 15m 59s | Max: 29m 39s | Hits:  92%/5706  
  🟩 20                 Pass: 100%/19  | Total:  5h 39m | Avg: 17m 51s | Max: 31m 42s | Hits:  97%/3023  
🟨 gpu
  🟨 v100               Pass:  97%/112 | Total:  1d 06h | Avg: 16m 22s | Max: 43m 42s | Hits:  96%/16707 
🟨 cpu
  🟨 amd64              Pass:  98%/104 | Total:  1d 04h | Avg: 16m 38s | Max: 43m 42s | Hits:  96%/16707 
  🟨 arm64              Pass:  87%/8   | Total:  1h 43m | Avg: 12m 56s | Max: 16m 01s

🟨 cub: Pass: 99%/131 | Total: 18h 25m | Avg: 8m 26s | Max: 31m 37s | Hits: 99%/4278

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  99%/123 | Total: 17h 51m | Avg:  8m 42s | Max: 31m 37s | Hits:  99%/4278  
  🟩 arm64              Pass: 100%/8   | Total: 33m 49s | Avg:  4m 13s | Max:  5m 00s
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 04m | Avg:  4m 18s | Max: 14m 26s | Hits:  99%/713   
  🟩 11.8               Pass: 100%/3   | Total: 13m 21s | Avg:  4m 27s | Max:  4m 36s
  🔍 12.5               Pass:  99%/113 | Total: 17h 07m | Avg:  9m 05s | Max: 31m 37s | Hits:  99%/3565  
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 09s | Avg:  3m 34s | Max:  3m 36s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 04m | Avg:  4m 18s | Max: 14m 26s | Hits:  99%/713   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 21s | Avg:  4m 27s | Max:  4m 36s
  🔍 nvcc12.5           Pass:  99%/111 | Total: 17h 00m | Avg:  9m 11s | Max: 31m 37s | Hits:  99%/3565  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 09s | Avg:  3m 34s | Max:  3m 36s
  🔍 nvcc               Pass:  99%/129 | Total: 18h 18m | Avg:  8m 31s | Max: 31m 37s | Hits:  99%/4278  
🔍 cxx: Clang9 🔍
  🔍 Clang9             Pass:  83%/6   | Total: 33m 18s | Avg:  5m 33s | Max: 11m 31s
  🟩 Clang10            Pass: 100%/3   | Total: 15m 25s | Avg:  5m 08s | Max:  5m 11s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 02s | Avg:  4m 30s | Max:  4m 44s
  🟩 Clang12            Pass: 100%/4   | Total: 17m 34s | Avg:  4m 23s | Max:  4m 31s
  🟩 Clang13            Pass: 100%/4   | Total: 17m 36s | Avg:  4m 24s | Max:  4m 31s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 09s | Avg:  4m 32s | Max:  4m 55s
  🟩 Clang15            Pass: 100%/4   | Total: 18m 09s | Avg:  4m 32s | Max:  4m 47s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 12s | Avg:  4m 33s | Max:  4m 42s
  🟩 Clang17            Pass: 100%/26  | Total:  6h 00m | Avg: 13m 52s | Max: 26m 34s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 48s | Avg:  3m 24s | Max:  3m 25s
  🟩 GCC7               Pass: 100%/6   | Total: 22m 22s | Avg:  3m 43s | Max:  4m 05s
  🟩 GCC8               Pass: 100%/6   | Total: 23m 11s | Avg:  3m 51s | Max:  4m 20s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 08s | Avg:  4m 01s | Max:  4m 24s
  🟩 GCC10              Pass: 100%/4   | Total: 17m 59s | Avg:  4m 29s | Max:  4m 44s
  🟩 GCC11              Pass: 100%/7   | Total: 30m 51s | Avg:  4m 24s | Max:  4m 38s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 30s | Avg:  4m 37s | Max:  5m 00s
  🟩 GCC13              Pass: 100%/28  | Total:  5h 53m | Avg: 12m 38s | Max: 31m 37s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 19s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 14m 26s | Avg: 14m 26s | Max: 14m 26s | Hits:  99%/713   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 24s | Avg: 11m 42s | Max: 12m 00s | Hits:  99%/1426  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 37m 30s | Avg: 12m 30s | Max: 12m 52s | Hits:  99%/2139  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  98%/59  | Total:  8h 37m | Avg:  8m 46s | Max: 26m 34s
  🟩 GCC                Pass: 100%/63  | Total:  8h 17m | Avg:  7m 54s | Max: 31m 37s
  🟩 Intel              Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 19s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 15m | Avg: 12m 33s | Max: 14m 26s | Hits:  99%/4278  
🔍 jobs: Build 🔍
  🔍 Build              Pass:  98%/99  | Total:  8h 02m | Avg:  4m 52s | Max: 14m 26s | Hits:  99%/4278  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  2h 28m | Avg: 18m 36s | Max: 20m 18s
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 07m | Avg: 15m 56s | Max: 17m 12s
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 20m | Avg: 17m 34s | Max: 20m 16s
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 26m | Avg: 25m 46s | Max: 31m 37s
🔍 std: 14 🔍
  🟩 11                 Pass: 100%/34  | Total:  4h 20m | Avg:  7m 39s | Max: 25m 15s
  🔍 14                 Pass:  97%/37  | Total:  5h 04m | Avg:  8m 13s | Max: 25m 21s | Hits:  99%/2139  
  🟩 17                 Pass: 100%/36  | Total:  5h 05m | Avg:  8m 29s | Max: 31m 37s | Hits:  99%/1426  
  🟩 20                 Pass: 100%/24  | Total:  3h 55m | Avg:  9m 48s | Max: 26m 34s | Hits:  99%/713   
🟨 gpu
  🟨 v100               Pass:  99%/131 | Total: 18h 25m | Avg:  8m 26s | Max: 31m 37s | Hits:  99%/4278  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 21s | Avg:  4m 27s | Max:  4m 36s
  🟩 90a                Pass: 100%/4   | Total: 14m 28s | Avg:  3m 37s | Max:  3m 43s

🟩 cudax: Pass: 100%/55 | Total: 2h 34m | Avg: 2m 49s | Max: 8m 32s | Hits: 72%/102

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 25m | Avg:  2m 51s | Max:  8m 32s | Hits:  72%/102   
  🟩 arm64              Pass: 100%/4   | Total:  9m 16s | Avg:  2m 19s | Max:  2m 33s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 04m | Avg:  2m 47s | Max:  7m 53s | Hits:  72%/51    
  🟩 12.5               Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  8m 32s | Hits:  72%/51    
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 04m | Avg:  2m 47s | Max:  7m 53s | Hits:  72%/51    
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  8m 32s | Hits:  72%/51    
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 34m | Avg:  2m 49s | Max:  8m 32s | Hits:  72%/102   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 54s | Avg:  2m 27s | Max:  2m 35s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 42s | Avg:  2m 21s | Max:  2m 37s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 28s | Avg:  2m 22s | Max:  2m 24s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 17s | Avg:  2m 19s | Max:  2m 30s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 59s | Avg:  2m 29s | Max:  2m 50s
  🟩 Clang14            Pass: 100%/6   | Total: 17m 24s | Avg:  2m 54s | Max:  4m 17s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 44s | Avg:  2m 22s | Max:  2m 22s
  🟩 Clang16            Pass: 100%/6   | Total: 19m 51s | Avg:  3m 18s | Max:  5m 21s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 29s | Avg:  2m 14s | Max:  2m 17s
  🟩 GCC10              Pass: 100%/4   | Total:  9m 30s | Avg:  2m 22s | Max:  2m 42s
  🟩 GCC11              Pass: 100%/4   | Total:  8m 46s | Avg:  2m 11s | Max:  2m 30s
  🟩 GCC12              Pass: 100%/12  | Total: 32m 24s | Avg:  2m 42s | Max:  4m 17s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  3m 06s | Avg:  3m 06s | Max:  3m 06s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  7m 53s | Avg:  7m 53s | Max:  7m 53s | Hits:  72%/51    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 32s | Avg:  8m 32s | Max:  8m 32s | Hits:  72%/51    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 20m | Avg:  2m 40s | Max:  5m 21s
  🟩 GCC                Pass: 100%/22  | Total: 55m 09s | Avg:  2m 30s | Max:  4m 17s
  🟩 Intel              Pass: 100%/1   | Total:  3m 06s | Avg:  3m 06s | Max:  3m 06s
  🟩 MSVC               Pass: 100%/2   | Total: 16m 25s | Avg:  8m 12s | Max:  8m 32s | Hits:  72%/102   
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 34m | Avg:  2m 49s | Max:  8m 32s | Hits:  72%/102   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 01m | Avg:  2m 35s | Max:  8m 32s | Hits:  72%/102   
  🟩 Test               Pass: 100%/8   | Total: 33m 03s | Avg:  4m 07s | Max:  5m 21s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 11s | Avg:  2m 11s | Max:  2m 11s
  🟩 90a                Pass: 100%/1   | Total:  2m 07s | Avg:  2m 07s | Max:  2m 07s
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 19m | Avg:  2m 34s | Max:  4m 40s
  🟩 20                 Pass: 100%/24  | Total:  1h 15m | Avg:  3m 07s | Max:  8m 32s | Hits:  72%/102

🟩 pycuda: Pass: 100%/1 | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 417)

#	Runner
305	`linux-amd64-cpu16`
61	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

libcudacxx/test/atomic_codegen/atomic_add_16b.cu

github-actions · 2024-08-21T04:16:14Z

🟨 CI finished in 3h 02m: Pass: 99%/421 | Total: 2d 14h | Avg: 8m 54s | Max: 1h 12m | Hits: 98%/34092

🟨 cub: Pass: 98%/131 | Total: 19h 28m | Avg: 8m 55s | Max: 1h 12m | Hits: 99%/4278

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  98%/123 | Total: 18h 56m | Avg:  9m 14s | Max:  1h 12m | Hits:  99%/4278  
  🟩 arm64              Pass: 100%/8   | Total: 32m 21s | Avg:  4m 02s | Max:  4m 18s
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 05m | Avg:  4m 21s | Max: 14m 12s | Hits:  99%/713   
  🟩 11.8               Pass: 100%/3   | Total: 13m 00s | Avg:  4m 20s | Max:  4m 30s
  🔍 12.5               Pass:  98%/113 | Total: 18h 10m | Avg:  9m 38s | Max:  1h 12m | Hits:  99%/3565  
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 45s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 05m | Avg:  4m 21s | Max: 14m 12s | Hits:  99%/713   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 00s | Avg:  4m 20s | Max:  4m 30s
  🔍 nvcc12.5           Pass:  98%/111 | Total: 18h 03m | Avg:  9m 45s | Max:  1h 12m | Hits:  99%/3565  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 45s
  🔍 nvcc               Pass:  98%/129 | Total: 19h 21m | Avg:  9m 00s | Max:  1h 12m | Hits:  99%/4278  
🔍 cxx: Clang17 🔍
  🟩 Clang9             Pass: 100%/6   | Total: 27m 18s | Avg:  4m 33s | Max:  5m 29s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 40s | Avg:  5m 53s | Max:  6m 55s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 37s | Avg:  4m 24s | Max:  4m 42s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 55s | Avg:  4m 43s | Max:  5m 14s
  🟩 Clang13            Pass: 100%/4   | Total: 17m 13s | Avg:  4m 18s | Max:  4m 33s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 26s | Avg:  4m 36s | Max:  4m 39s
  🟩 Clang15            Pass: 100%/4   | Total: 17m 51s | Avg:  4m 27s | Max:  4m 36s
  🟩 Clang16            Pass: 100%/4   | Total: 17m 58s | Avg:  4m 29s | Max:  4m 38s
  🔍 Clang17            Pass:  92%/26  | Total:  5h 15m | Avg: 12m 07s | Max: 25m 15s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 49s | Avg:  3m 24s | Max:  3m 29s
  🟩 GCC7               Pass: 100%/6   | Total: 23m 32s | Avg:  3m 55s | Max:  4m 41s
  🟩 GCC8               Pass: 100%/6   | Total: 24m 41s | Avg:  4m 06s | Max:  4m 45s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 38s | Avg:  4m 06s | Max:  4m 45s
  🟩 GCC10              Pass: 100%/4   | Total: 17m 33s | Avg:  4m 23s | Max:  4m 40s
  🟩 GCC11              Pass: 100%/7   | Total: 31m 01s | Avg:  4m 25s | Max:  4m 40s
  🟩 GCC12              Pass: 100%/4   | Total: 17m 25s | Avg:  4m 21s | Max:  4m 27s
  🟩 GCC13              Pass: 100%/28  | Total:  7h 45m | Avg: 16m 36s | Max:  1h 12m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 37s | Avg:  5m 12s | Max:  5m 34s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 14m 12s | Avg: 14m 12s | Max: 14m 12s | Hits:  99%/713   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 11s | Avg: 11m 35s | Max: 11m 44s | Hits:  99%/1426  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 36m 37s | Avg: 12m 12s | Max: 13m 08s | Hits:  99%/2139  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  96%/59  | Total:  7h 48m | Avg:  7m 56s | Max: 25m 15s
  🟩 GCC                Pass: 100%/63  | Total: 10h 10m | Avg:  9m 41s | Max:  1h 12m
  🟩 Intel              Pass: 100%/3   | Total: 15m 37s | Avg:  5m 12s | Max:  5m 34s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 14m | Avg: 12m 20s | Max: 14m 12s | Hits:  99%/4278  
🔍 jobs: HostLaunch 🔍
  🟩 Build              Pass: 100%/99  | Total:  7h 59m | Avg:  4m 50s | Max: 14m 12s | Hits:  99%/4278  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  2h 36m | Avg: 19m 30s | Max: 23m 15s
  🟩 GraphCapture       Pass: 100%/8   | Total:  3h 03m | Avg: 22m 59s | Max:  1h 12m
  🔍 HostLaunch         Pass:  75%/8   | Total:  1h 56m | Avg: 14m 35s | Max: 20m 08s
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 52m | Avg: 29m 06s | Max: 47m 51s
🟨 std
  🟩 11                 Pass: 100%/34  | Total:  4h 32m | Avg:  8m 01s | Max: 45m 57s
  🟨 14                 Pass:  97%/37  | Total:  5h 18m | Avg:  8m 36s | Max: 47m 51s | Hits:  99%/2139  
  🟩 17                 Pass: 100%/36  | Total:  4h 56m | Avg:  8m 14s | Max: 23m 58s | Hits:  99%/1426  
  🟨 20                 Pass:  95%/24  | Total:  4h 40m | Avg: 11m 42s | Max:  1h 12m | Hits:  99%/713   
🟨 gpu
  🟨 v100               Pass:  98%/131 | Total: 19h 28m | Avg:  8m 55s | Max:  1h 12m | Hits:  99%/4278  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 00s | Avg:  4m 20s | Max:  4m 30s
  🟩 90a                Pass: 100%/4   | Total: 14m 30s | Avg:  3m 37s | Max:  3m 52s

🟨 libcudacxx: Pass: 98%/112 | Total: 1d 03h | Avg: 14m 44s | Max: 25m 42s | Hits: 98%/16707

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  98%/104 | Total:  1d 01h | Avg: 14m 54s | Max: 25m 42s | Hits:  98%/16707 
  🟩 arm64              Pass: 100%/8   | Total:  1h 39m | Avg: 12m 29s | Max: 14m 06s
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  2h 53m | Avg: 11m 35s | Max: 18m 05s | Hits:  97%/2592  
  🟩 11.8               Pass: 100%/3   | Total: 50m 05s | Avg: 16m 41s | Max: 21m 54s
  🔍 12.5               Pass:  97%/94  | Total: 23h 46m | Avg: 15m 10s | Max: 25m 42s | Hits:  98%/14115 
🚨 cudacxx: ClangCUDA17 🚨
  🔥 ClangCUDA17        Pass:   0%/2   | Total: 36m 31s | Avg: 18m 15s | Max: 18m 49s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 53m | Avg: 11m 35s | Max: 18m 05s | Hits:  97%/2592  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 50m 05s | Avg: 16m 41s | Max: 21m 54s
  🟩 nvcc12.5           Pass: 100%/92  | Total: 23h 10m | Avg: 15m 06s | Max: 25m 42s | Hits:  98%/14115 
🚨 cudacxx_family: ClangCUDA 🚨
  🔥 ClangCUDA          Pass:   0%/2   | Total: 36m 31s | Avg: 18m 15s | Max: 18m 49s
  🟩 nvcc               Pass: 100%/110 | Total:  1d 02h | Avg: 14m 40s | Max: 25m 42s | Hits:  98%/16707 
🔍 cxx: Clang17 🔍
  🟩 Clang9             Pass: 100%/6   | Total:  1h 20m | Avg: 13m 29s | Max: 16m 01s
  🟩 Clang10            Pass: 100%/3   | Total: 49m 30s | Avg: 16m 30s | Max: 18m 59s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 00m | Avg: 15m 11s | Max: 16m 12s
  🟩 Clang12            Pass: 100%/4   | Total: 57m 51s | Avg: 14m 27s | Max: 14m 47s
  🟩 Clang13            Pass: 100%/4   | Total: 56m 49s | Avg: 14m 12s | Max: 14m 44s
  🟩 Clang14            Pass: 100%/4   | Total: 59m 25s | Avg: 14m 51s | Max: 16m 18s
  🟩 Clang15            Pass: 100%/4   | Total:  1h 00m | Avg: 15m 07s | Max: 15m 17s
  🟩 Clang16            Pass: 100%/4   | Total: 57m 52s | Avg: 14m 28s | Max: 14m 52s
  🔍 Clang17            Pass:  85%/14  | Total:  3h 48m | Avg: 16m 18s | Max: 25m 34s
  🟩 GCC6               Pass: 100%/2   | Total: 22m 08s | Avg: 11m 04s | Max: 11m 13s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 15m | Avg: 12m 30s | Max: 14m 14s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 15m | Avg: 12m 36s | Max: 14m 09s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 18m | Avg: 13m 03s | Max: 15m 45s
  🟩 GCC10              Pass: 100%/4   | Total:  1h 05m | Avg: 16m 27s | Max: 18m 42s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 48m | Avg: 15m 33s | Max: 21m 54s
  🟩 GCC12              Pass: 100%/4   | Total: 57m 06s | Avg: 14m 16s | Max: 15m 14s
  🟩 GCC13              Pass: 100%/21  | Total:  5h 21m | Avg: 15m 19s | Max: 25m 42s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 46m 23s | Avg: 15m 27s | Max: 15m 47s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 05s | Avg: 18m 05s | Max: 18m 05s | Hits:  97%/2592  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 26m 40s | Avg: 13m 20s | Max: 13m 22s | Hits:  98%/5546  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 42m 34s | Avg: 14m 11s | Max: 15m 08s | Hits:  98%/8569  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  95%/47  | Total: 11h 52m | Avg: 15m 09s | Max: 25m 34s
  🟩 GCC                Pass: 100%/56  | Total: 13h 24m | Avg: 14m 22s | Max: 25m 42s
  🟩 Intel              Pass: 100%/3   | Total: 46m 23s | Avg: 15m 27s | Max: 15m 47s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 27m | Avg: 14m 33s | Max: 18m 05s | Hits:  98%/16707 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  97%/99  | Total: 22h 58m | Avg: 13m 55s | Max: 21m 54s | Hits:  98%/16707 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 23m | Avg: 20m 49s | Max: 25m 42s
  🟩 Test               Pass: 100%/8   | Total:  3h 07m | Avg: 23m 23s | Max: 25m 34s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 01s | Avg:  2m 01s | Max:  2m 01s
🟨 std
  🟩 11                 Pass: 100%/29  | Total:  7h 06m | Avg: 14m 43s | Max: 23m 22s
  🟩 14                 Pass: 100%/32  | Total:  7h 42m | Avg: 14m 26s | Max: 24m 25s | Hits:  97%/7978  
  🟨 17                 Pass:  96%/31  | Total:  7h 43m | Avg: 14m 56s | Max: 25m 42s | Hits:  98%/5706  
  🟨 20                 Pass:  94%/19  | Total:  4h 56m | Avg: 15m 35s | Max: 25m 34s | Hits:  97%/3023  
🟨 gpu
  🟨 v100               Pass:  98%/112 | Total:  1d 03h | Avg: 14m 44s | Max: 25m 42s | Hits:  98%/16707 
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 50m 05s | Avg: 16m 41s | Max: 21m 54s
  🟩 90a                Pass: 100%/4   | Total: 38m 05s | Avg:  9m 31s | Max:  9m 59s

🟩 thrust: Pass: 100%/118 | Total: 12h 26m | Avg: 6m 19s | Max: 33m 47s | Hits: 99%/13005

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 11h 54m | Avg:  6m 29s | Max: 33m 47s | Hits:  99%/13005 
  🟩 arm64              Pass: 100%/8   | Total: 31m 31s | Avg:  3m 56s | Max:  4m 29s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 02m | Avg:  4m 08s | Max: 15m 07s | Hits:  99%/1445  
  🟩 11.8               Pass: 100%/3   | Total: 12m 21s | Avg:  4m 07s | Max:  4m 21s
  🟩 12.5               Pass: 100%/100 | Total: 11h 11m | Avg:  6m 42s | Max: 33m 47s | Hits:  99%/11560 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  8m 24s | Avg:  4m 12s | Max:  4m 13s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 02m | Avg:  4m 08s | Max: 15m 07s | Hits:  99%/1445  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 12m 21s | Avg:  4m 07s | Max:  4m 21s
  🟩 nvcc12.5           Pass: 100%/98  | Total: 11h 03m | Avg:  6m 46s | Max: 33m 47s | Hits:  99%/11560 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 24s | Avg:  4m 12s | Max:  4m 13s
  🟩 nvcc               Pass: 100%/116 | Total: 12h 17m | Avg:  6m 21s | Max: 33m 47s | Hits:  99%/13005 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 24m 46s | Avg:  4m 07s | Max:  5m 15s
  🟩 Clang10            Pass: 100%/3   | Total: 14m 38s | Avg:  4m 52s | Max:  4m 59s
  🟩 Clang11            Pass: 100%/4   | Total: 16m 12s | Avg:  4m 03s | Max:  4m 16s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 21s | Avg:  4m 05s | Max:  4m 26s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 33s | Avg:  4m 08s | Max:  4m 18s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 27s
  🟩 Clang15            Pass: 100%/4   | Total: 16m 22s | Avg:  4m 05s | Max:  4m 25s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 02s | Avg:  4m 00s | Max:  4m 18s
  🟩 Clang17            Pass: 100%/18  | Total:  1h 58m | Avg:  6m 33s | Max: 15m 07s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 17s | Avg:  3m 08s | Max:  3m 10s
  🟩 GCC7               Pass: 100%/6   | Total: 21m 29s | Avg:  3m 34s | Max:  4m 05s
  🟩 GCC8               Pass: 100%/6   | Total: 22m 12s | Avg:  3m 42s | Max:  4m 15s
  🟩 GCC9               Pass: 100%/6   | Total: 21m 34s | Avg:  3m 35s | Max:  4m 09s
  🟩 GCC10              Pass: 100%/4   | Total: 17m 30s | Avg:  4m 22s | Max:  4m 47s
  🟩 GCC11              Pass: 100%/7   | Total: 28m 54s | Avg:  4m 07s | Max:  4m 21s
  🟩 GCC12              Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 41s
  🟩 GCC13              Pass: 100%/20  | Total:  3h 08m | Avg:  9m 26s | Max: 33m 47s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 40s | Avg:  5m 13s | Max:  5m 42s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 07s | Avg: 15m 07s | Max: 15m 07s | Hits:  99%/1445  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 29m 07s | Avg: 14m 33s | Max: 15m 08s | Hits:  99%/2890  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 45m | Avg: 17m 38s | Max: 21m 09s | Hits:  99%/8670  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  4h 16m | Avg:  5m 01s | Max: 15m 07s
  🟩 GCC                Pass: 100%/55  | Total:  5h 24m | Avg:  5m 53s | Max: 33m 47s
  🟩 Intel              Pass: 100%/3   | Total: 15m 40s | Avg:  5m 13s | Max:  5m 42s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 30m | Avg: 16m 40s | Max: 21m 09s | Hits:  99%/13005 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 12h 26m | Avg:  6m 19s | Max: 33m 47s | Hits:  99%/13005 
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 48m | Avg:  4m 43s | Max: 15m 50s | Hits:  99%/8670  
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 54m | Avg: 10m 22s | Max: 21m 09s | Hits:  99%/4335  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 43m | Avg: 20m 26s | Max: 33m 47s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 12m 21s | Avg:  4m 07s | Max:  4m 21s
  🟩 90a                Pass: 100%/4   | Total: 14m 26s | Avg:  3m 36s | Max:  3m 54s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 37m | Avg:  5m 15s | Max: 33m 25s
  🟩 14                 Pass: 100%/34  | Total:  3h 45m | Avg:  6m 37s | Max: 32m 38s | Hits:  99%/5780  
  🟩 17                 Pass: 100%/33  | Total:  3h 23m | Avg:  6m 09s | Max: 20m 36s | Hits:  99%/4335  
  🟩 20                 Pass: 100%/21  | Total:  2h 39m | Avg:  7m 36s | Max: 33m 47s | Hits:  99%/2890

🟩 cudax: Pass: 100%/55 | Total: 2h 34m | Avg: 2m 49s | Max: 9m 28s | Hits: 72%/102

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 25m | Avg:  2m 51s | Max:  9m 28s | Hits:  72%/102   
  🟩 arm64              Pass: 100%/4   | Total:  9m 04s | Avg:  2m 16s | Max:  2m 32s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 03m | Avg:  2m 46s | Max:  8m 57s | Hits:  72%/51    
  🟩 12.5               Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  9m 28s | Hits:  72%/51    
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 03m | Avg:  2m 46s | Max:  8m 57s | Hits:  72%/51    
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  9m 28s | Hits:  72%/51    
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 34m | Avg:  2m 49s | Max:  9m 28s | Hits:  72%/102   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 45s | Avg:  2m 22s | Max:  2m 23s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 41s | Avg:  2m 20s | Max:  2m 22s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 12s | Avg:  2m 18s | Max:  2m 27s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 01s | Avg:  2m 15s | Max:  2m 22s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 40s | Avg:  2m 25s | Max:  2m 35s
  🟩 Clang14            Pass: 100%/6   | Total: 17m 30s | Avg:  2m 55s | Max:  3m 46s
  🟩 Clang15            Pass: 100%/2   | Total:  5m 18s | Avg:  2m 39s | Max:  2m 46s
  🟩 Clang16            Pass: 100%/6   | Total: 17m 53s | Avg:  2m 58s | Max:  4m 07s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 27s | Avg:  2m 13s | Max:  2m 21s
  🟩 GCC10              Pass: 100%/4   | Total:  9m 16s | Avg:  2m 19s | Max:  2m 30s
  🟩 GCC11              Pass: 100%/4   | Total:  8m 31s | Avg:  2m 07s | Max:  2m 13s
  🟩 GCC12              Pass: 100%/12  | Total: 33m 05s | Avg:  2m 45s | Max:  4m 03s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  3m 11s | Avg:  3m 11s | Max:  3m 11s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 57s | Avg:  8m 57s | Max:  8m 57s | Hits:  72%/51    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  9m 28s | Avg:  9m 28s | Max:  9m 28s | Hits:  72%/51    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 18m | Avg:  2m 36s | Max:  4m 07s
  🟩 GCC                Pass: 100%/22  | Total: 55m 19s | Avg:  2m 30s | Max:  4m 03s
  🟩 Intel              Pass: 100%/1   | Total:  3m 11s | Avg:  3m 11s | Max:  3m 11s
  🟩 MSVC               Pass: 100%/2   | Total: 18m 25s | Avg:  9m 12s | Max:  9m 28s | Hits:  72%/102   
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 34m | Avg:  2m 49s | Max:  9m 28s | Hits:  72%/102   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 04m | Avg:  2m 39s | Max:  9m 28s | Hits:  72%/102   
  🟩 Test               Pass: 100%/8   | Total: 30m 13s | Avg:  3m 46s | Max:  4m 07s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 54s | Avg:  1m 54s | Max:  1m 54s
  🟩 90a                Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 19m | Avg:  2m 33s | Max:  4m 03s
  🟩 20                 Pass: 100%/24  | Total:  1h 15m | Avg:  3m 09s | Max:  9m 28s | Hits:  72%/102

🟩 cccl: Pass: 100%/4 | Total: 18m 04s | Avg: 4m 31s | Max: 5m 05s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  5m 05s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 20s | Avg:  4m 10s | Max:  4m 39s
  🟩 12.5               Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  5m 05s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 20s | Avg:  4m 10s | Max:  4m 39s
  🟩 nvcc12.5           Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  5m 05s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  5m 05s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 39s | Avg:  4m 39s | Max:  4m 39s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 05s | Avg:  5m 05s | Max:  5m 05s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 41s | Avg:  3m 41s | Max:  3m 41s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 39s | Avg:  4m 39s | Max:  4m 39s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  5m 05s
  🟩 GCC                Pass: 100%/2   | Total:  8m 20s | Avg:  4m 10s | Max:  4m 39s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  5m 05s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  5m 05s

🟩 pycuda: Pass: 100%/1 | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 421)

#	Runner
305	`linux-amd64-cpu16`
65	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

github-actions · 2024-08-28T07:13:36Z

🟨 CI finished in 13h 52m: Pass: 94%/421 | Total: 2d 06h | Avg: 7m 43s | Max: 53m 08s | Hits: 94%/34092

🟨 libcudacxx: Pass: 79%/112 | Total: 17h 31m | Avg: 9m 23s | Max: 41m 39s | Hits: 90%/16707

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  77%/104 | Total: 16h 20m | Avg:  9m 25s | Max: 41m 39s | Hits:  90%/16707 
  🟩 arm64              Pass: 100%/8   | Total:  1h 10m | Avg:  8m 51s | Max: 12m 50s
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  51%/47  | Total:  6h 20m | Avg:  8m 06s | Max: 27m 23s
  🟩 GCC                Pass: 100%/56  | Total:  8h 54m | Avg:  9m 32s | Max: 41m 39s
  🟩 Intel              Pass: 100%/3   | Total: 35m 34s | Avg: 11m 51s | Max: 15m 26s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 40m | Avg: 16m 46s | Max: 26m 47s | Hits:  90%/16707 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  76%/99  | Total: 13h 40m | Avg:  8m 17s | Max: 41m 39s | Hits:  90%/16707 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 23m | Avg: 20m 45s | Max: 22m 50s
  🟩 Test               Pass: 100%/8   | Total:  2h 26m | Avg: 18m 15s | Max: 27m 23s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 54s | Avg:  1m 54s | Max:  1m 54s
🟨 ctk
  🟨 11.1               Pass:  80%/15  | Total:  2h 31m | Avg: 10m 07s | Max: 41m 39s | Hits:  99%/2592  
  🟩 11.8               Pass: 100%/3   | Total: 35m 30s | Avg: 11m 50s | Max: 19m 25s
  🟨 12.5               Pass:  78%/94  | Total: 14h 23m | Avg:  9m 11s | Max: 27m 23s | Hits:  89%/14115 
🟨 cudacxx
  🟥 ClangCUDA17        Pass:   0%/2   | Total: 36m 26s | Avg: 18m 13s | Max: 19m 28s
  🟨 nvcc11.1           Pass:  80%/15  | Total:  2h 31m | Avg: 10m 07s | Max: 41m 39s | Hits:  99%/2592  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 35m 30s | Avg: 11m 50s | Max: 19m 25s
  🟨 nvcc12.5           Pass:  80%/92  | Total: 13h 47m | Avg:  8m 59s | Max: 27m 23s | Hits:  89%/14115 
🟨 cxx
  🟥 Clang9             Pass:   0%/6   | Total: 17m 41s | Avg:  2m 56s | Max:  3m 33s
  🟥 Clang10            Pass:   0%/3   | Total: 10m 22s | Avg:  3m 27s | Max:  3m 34s
  🟥 Clang11            Pass:   0%/4   | Total: 10m 36s | Avg:  2m 39s | Max:  2m 45s
  🟥 Clang12            Pass:   0%/4   | Total: 12m 24s | Avg:  3m 06s | Max:  4m 23s
  🟥 Clang13            Pass:   0%/4   | Total: 35m 43s | Avg:  8m 55s | Max: 15m 53s
  🟩 Clang14            Pass: 100%/4   | Total: 37m 55s | Avg:  9m 28s | Max: 16m 39s
  🟩 Clang15            Pass: 100%/4   | Total: 35m 42s | Avg:  8m 55s | Max: 14m 09s
  🟩 Clang16            Pass: 100%/4   | Total: 37m 15s | Avg:  9m 18s | Max: 15m 10s
  🟨 Clang17            Pass:  85%/14  | Total:  3h 03m | Avg: 13m 05s | Max: 27m 23s
  🟩 GCC6               Pass: 100%/2   | Total: 13m 20s | Avg:  6m 40s | Max: 10m 39s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 34m | Avg: 15m 41s | Max: 41m 39s
  🟩 GCC8               Pass: 100%/6   | Total: 51m 49s | Avg:  8m 38s | Max: 13m 38s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 34s | Avg:  4m 25s | Max: 11m 09s
  🟩 GCC10              Pass: 100%/4   | Total: 24m 00s | Avg:  6m 00s | Max: 14m 07s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 10m | Avg: 10m 00s | Max: 19m 25s
  🟩 GCC12              Pass: 100%/4   | Total: 13m 28s | Avg:  3m 22s | Max:  3m 41s
  🟩 GCC13              Pass: 100%/21  | Total:  4h 00m | Avg: 11m 28s | Max: 23m 03s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 35m 34s | Avg: 11m 51s | Max: 15m 26s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 00s | Avg: 20m 00s | Max: 20m 00s | Hits:  99%/2592  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 40m 41s | Avg: 20m 20s | Max: 26m 47s | Hits:  73%/5546  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 39m 55s | Avg: 13m 18s | Max: 13m 55s | Hits:  99%/8569  
🟨 gpu
  🟨 v100               Pass:  79%/112 | Total: 17h 31m | Avg:  9m 23s | Max: 41m 39s | Hits:  90%/16707 
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total: 36m 26s | Avg: 18m 13s | Max: 19m 28s
  🟨 nvcc               Pass:  80%/110 | Total: 16h 54m | Avg:  9m 13s | Max: 41m 39s | Hits:  90%/16707 
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 35m 30s | Avg: 11m 50s | Max: 19m 25s
  🟩 90a                Pass: 100%/4   | Total: 14m 04s | Avg:  3m 31s | Max:  3m 47s
🟨 std
  🟨 11                 Pass:  79%/29  | Total:  3h 59m | Avg:  8m 15s | Max: 41m 39s
  🟨 14                 Pass:  81%/32  | Total:  4h 39m | Avg:  8m 44s | Max: 26m 47s | Hits:  81%/7978  
  🟨 17                 Pass:  77%/31  | Total:  5h 40m | Avg: 10m 58s | Max: 23m 00s | Hits:  99%/5706  
  🟨 20                 Pass:  78%/19  | Total:  3h 10m | Avg: 10m 00s | Max: 27m 23s | Hits:  99%/3023

🟩 cub: Pass: 100%/131 | Total: 20h 32m | Avg: 9m 24s | Max: 53m 08s | Hits: 99%/4278

🟩 cpu
  🟩 amd64              Pass: 100%/123 | Total: 19h 59m | Avg:  9m 45s | Max: 53m 08s | Hits:  99%/4278  
  🟩 arm64              Pass: 100%/8   | Total: 33m 13s | Avg:  4m 09s | Max:  5m 00s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 14m 02s | Hits:  99%/713   
  🟩 11.8               Pass: 100%/3   | Total: 13m 47s | Avg:  4m 35s | Max:  4m 53s
  🟩 12.5               Pass: 100%/113 | Total: 19h 16m | Avg: 10m 13s | Max: 53m 08s | Hits:  99%/3565  
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 08s | Avg:  3m 34s | Max:  3m 34s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 14m 02s | Hits:  99%/713   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 47s | Avg:  4m 35s | Max:  4m 53s
  🟩 nvcc12.5           Pass: 100%/111 | Total: 19h 08m | Avg: 10m 21s | Max: 53m 08s | Hits:  99%/3565  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 08s | Avg:  3m 34s | Max:  3m 34s
  🟩 nvcc               Pass: 100%/129 | Total: 20h 25m | Avg:  9m 30s | Max: 53m 08s | Hits:  99%/4278  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 27m 07s | Avg:  4m 31s | Max:  5m 22s
  🟩 Clang10            Pass: 100%/3   | Total: 15m 09s | Avg:  5m 03s | Max:  5m 21s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 42s | Avg:  4m 25s | Max:  4m 46s
  🟩 Clang12            Pass: 100%/4   | Total: 17m 07s | Avg:  4m 16s | Max:  4m 32s
  🟩 Clang13            Pass: 100%/4   | Total: 17m 29s | Avg:  4m 22s | Max:  4m 29s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  4m 48s
  🟩 Clang15            Pass: 100%/4   | Total: 17m 30s | Avg:  4m 22s | Max:  4m 37s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  4m 39s
  🟩 Clang17            Pass: 100%/26  | Total:  7h 16m | Avg: 16m 48s | Max: 53m 08s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 41s | Avg:  3m 20s | Max:  3m 26s
  🟩 GCC7               Pass: 100%/6   | Total: 22m 33s | Avg:  3m 45s | Max:  4m 24s
  🟩 GCC8               Pass: 100%/6   | Total: 23m 04s | Avg:  3m 50s | Max:  4m 29s
  🟩 GCC9               Pass: 100%/6   | Total: 23m 06s | Avg:  3m 51s | Max:  4m 12s
  🟩 GCC10              Pass: 100%/4   | Total: 17m 17s | Avg:  4m 19s | Max:  4m 39s
  🟩 GCC11              Pass: 100%/7   | Total: 30m 48s | Avg:  4m 24s | Max:  4m 53s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 29s | Avg:  4m 37s | Max:  4m 49s
  🟩 GCC13              Pass: 100%/28  | Total:  6h 56m | Avg: 14m 51s | Max: 42m 27s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 14m 51s | Avg:  4m 57s | Max:  5m 11s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 14m 02s | Avg: 14m 02s | Max: 14m 02s | Hits:  99%/713   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 24s | Avg: 11m 42s | Max: 11m 44s | Hits:  99%/1426  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 37m 18s | Avg: 12m 26s | Max: 12m 43s | Hits:  99%/2139  
🟩 cxx_family
  🟩 Clang              Pass: 100%/59  | Total:  9h 45m | Avg:  9m 55s | Max: 53m 08s
  🟩 GCC                Pass: 100%/63  | Total:  9h 18m | Avg:  8m 51s | Max: 42m 27s
  🟩 Intel              Pass: 100%/3   | Total: 14m 51s | Avg:  4m 57s | Max:  5m 11s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 14m | Avg: 12m 27s | Max: 14m 02s | Hits:  99%/4278  
🟩 gpu
  🟩 v100               Pass: 100%/131 | Total: 20h 32m | Avg:  9m 24s | Max: 53m 08s | Hits:  99%/4278  
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 50m | Avg:  4m 44s | Max: 14m 02s | Hits:  99%/4278  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  3h 02m | Avg: 22m 47s | Max: 31m 45s
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 04m | Avg: 15m 34s | Max: 19m 47s
  🟩 HostLaunch         Pass: 100%/8   | Total:  3h 04m | Avg: 23m 02s | Max: 29m 39s
  🟩 TestGPU            Pass: 100%/8   | Total:  4h 31m | Avg: 33m 56s | Max: 53m 08s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 47s | Avg:  4m 35s | Max:  4m 53s
  🟩 90a                Pass: 100%/4   | Total: 14m 51s | Avg:  3m 42s | Max:  3m 49s
🟩 std
  🟩 11                 Pass: 100%/34  | Total:  4h 33m | Avg:  8m 02s | Max: 33m 58s
  🟩 14                 Pass: 100%/37  | Total:  5h 17m | Avg:  8m 35s | Max: 39m 28s | Hits:  99%/2139  
  🟩 17                 Pass: 100%/36  | Total:  5h 24m | Avg:  9m 01s | Max: 31m 12s | Hits:  99%/1426  
  🟩 20                 Pass: 100%/24  | Total:  5h 17m | Avg: 13m 12s | Max: 53m 08s | Hits:  99%/713

🟩 thrust: Pass: 100%/118 | Total: 13h 13m | Avg: 6m 43s | Max: 40m 03s | Hits: 99%/13005

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 12h 42m | Avg:  6m 55s | Max: 40m 03s | Hits:  99%/13005 
  🟩 arm64              Pass: 100%/8   | Total: 30m 53s | Avg:  3m 51s | Max:  4m 31s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 02m | Avg:  4m 11s | Max: 16m 17s | Hits:  99%/1445  
  🟩 11.8               Pass: 100%/3   | Total: 11m 50s | Avg:  3m 56s | Max:  4m 15s
  🟩 12.5               Pass: 100%/100 | Total: 11h 58m | Avg:  7m 11s | Max: 40m 03s | Hits:  99%/11560 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 21s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 02m | Avg:  4m 11s | Max: 16m 17s | Hits:  99%/1445  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 11m 50s | Avg:  3m 56s | Max:  4m 15s
  🟩 nvcc12.5           Pass: 100%/98  | Total: 11h 50m | Avg:  7m 14s | Max: 40m 03s | Hits:  99%/11560 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 21s
  🟩 nvcc               Pass: 100%/116 | Total: 13h 05m | Avg:  6m 46s | Max: 40m 03s | Hits:  99%/13005 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 24m 17s | Avg:  4m 02s | Max:  4m 51s
  🟩 Clang10            Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  4m 48s
  🟩 Clang11            Pass: 100%/4   | Total: 15m 49s | Avg:  3m 57s | Max:  4m 09s
  🟩 Clang12            Pass: 100%/4   | Total: 15m 28s | Avg:  3m 52s | Max:  4m 17s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 01s | Avg:  4m 00s | Max:  4m 12s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 06s | Avg:  4m 01s | Max:  4m 14s
  🟩 Clang15            Pass: 100%/4   | Total: 16m 43s | Avg:  4m 10s | Max:  4m 24s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 47s | Avg:  4m 11s | Max:  4m 33s
  🟩 Clang17            Pass: 100%/18  | Total:  2h 58m | Avg:  9m 54s | Max: 40m 03s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 28s | Avg:  3m 14s | Max:  3m 22s
  🟩 GCC7               Pass: 100%/6   | Total: 21m 15s | Avg:  3m 32s | Max:  3m 52s
  🟩 GCC8               Pass: 100%/6   | Total: 21m 35s | Avg:  3m 35s | Max:  4m 08s
  🟩 GCC9               Pass: 100%/6   | Total: 22m 29s | Avg:  3m 44s | Max:  4m 34s
  🟩 GCC10              Pass: 100%/4   | Total: 16m 06s | Avg:  4m 01s | Max:  4m 20s
  🟩 GCC11              Pass: 100%/7   | Total: 52m 23s | Avg:  7m 29s | Max: 27m 19s
  🟩 GCC12              Pass: 100%/4   | Total: 16m 54s | Avg:  4m 13s | Max:  4m 32s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 38m | Avg:  7m 54s | Max: 28m 05s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 14m 55s | Avg:  4m 58s | Max:  5m 23s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 17s | Avg: 16m 17s | Max: 16m 17s | Hits:  99%/1445  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 28m 22s | Avg: 14m 11s | Max: 14m 47s | Hits:  99%/2890  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 44m | Avg: 17m 28s | Max: 21m 44s | Hits:  99%/8670  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  5h 13m | Avg:  6m 09s | Max: 40m 03s
  🟩 GCC                Pass: 100%/55  | Total:  5h 15m | Avg:  5m 44s | Max: 28m 05s
  🟩 Intel              Pass: 100%/3   | Total: 14m 55s | Avg:  4m 58s | Max:  5m 23s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 29m | Avg: 16m 36s | Max: 21m 44s | Hits:  99%/13005 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 13h 13m | Avg:  6m 43s | Max: 40m 03s | Hits:  99%/13005 
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  8h 03m | Avg:  4m 53s | Max: 27m 19s | Hits:  99%/8670  
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 55m | Avg: 10m 31s | Max: 21m 44s | Hits:  99%/4335  
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 14m | Avg: 24m 17s | Max: 40m 03s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 11m 50s | Avg:  3m 56s | Max:  4m 15s
  🟩 90a                Pass: 100%/4   | Total: 14m 17s | Avg:  3m 34s | Max:  3m 46s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 41m | Avg:  5m 23s | Max: 40m 03s
  🟩 14                 Pass: 100%/34  | Total:  4h 02m | Avg:  7m 08s | Max: 27m 19s | Hits:  99%/5780  
  🟩 17                 Pass: 100%/33  | Total:  3h 56m | Avg:  7m 09s | Max: 38m 23s | Hits:  99%/4335  
  🟩 20                 Pass: 100%/21  | Total:  2h 32m | Avg:  7m 16s | Max: 28m 05s | Hits:  99%/2890

🟩 cudax: Pass: 100%/55 | Total: 2h 21m | Avg: 2m 33s | Max: 8m 57s | Hits: 82%/102

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 13m | Avg:  2m 37s | Max:  8m 57s | Hits:  82%/102   
  🟩 arm64              Pass: 100%/4   | Total:  7m 38s | Avg:  1m 54s | Max:  2m 50s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 00m | Avg:  2m 38s | Max:  8m 57s | Hits:  82%/51    
  🟩 12.5               Pass: 100%/32  | Total:  1h 20m | Avg:  2m 30s | Max:  8m 07s | Hits:  82%/51    
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 00m | Avg:  2m 38s | Max:  8m 57s | Hits:  82%/51    
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 20m | Avg:  2m 30s | Max:  8m 07s | Hits:  82%/51    
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 21m | Avg:  2m 33s | Max:  8m 57s | Hits:  82%/102   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  3m 59s | Avg:  1m 59s | Max:  2m 02s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 02s | Avg:  2m 01s | Max:  2m 04s
  🟩 Clang11            Pass: 100%/4   | Total:  8m 09s | Avg:  2m 02s | Max:  2m 06s
  🟩 Clang12            Pass: 100%/4   | Total:  8m 21s | Avg:  2m 05s | Max:  2m 12s
  🟩 Clang13            Pass: 100%/4   | Total:  8m 03s | Avg:  2m 00s | Max:  2m 16s
  🟩 Clang14            Pass: 100%/6   | Total: 16m 46s | Avg:  2m 47s | Max:  4m 24s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 10s | Avg:  2m 05s | Max:  2m 13s
  🟩 Clang16            Pass: 100%/6   | Total: 17m 21s | Avg:  2m 53s | Max:  4m 32s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 12s | Avg:  2m 06s | Max:  2m 10s
  🟩 GCC10              Pass: 100%/4   | Total:  7m 41s | Avg:  1m 55s | Max:  2m 03s
  🟩 GCC11              Pass: 100%/4   | Total:  7m 34s | Avg:  1m 53s | Max:  2m 13s
  🟩 GCC12              Pass: 100%/12  | Total: 31m 03s | Avg:  2m 35s | Max:  4m 53s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 57s | Avg:  8m 57s | Max:  8m 57s | Hits:  82%/51    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 07s | Avg:  8m 07s | Max:  8m 07s | Hits:  82%/51    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 10m | Avg:  2m 21s | Max:  4m 32s
  🟩 GCC                Pass: 100%/22  | Total: 50m 30s | Avg:  2m 17s | Max:  4m 53s
  🟩 Intel              Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 04s | Avg:  8m 32s | Max:  8m 57s | Hits:  82%/102   
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 21m | Avg:  2m 33s | Max:  8m 57s | Hits:  82%/102   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  1h 47m | Avg:  2m 17s | Max:  8m 57s | Hits:  82%/102   
  🟩 Test               Pass: 100%/8   | Total: 33m 15s | Avg:  4m 09s | Max:  4m 53s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 53s | Avg:  1m 53s | Max:  1m 53s
  🟩 90a                Pass: 100%/1   | Total:  2m 17s | Avg:  2m 17s | Max:  2m 17s
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 09m | Avg:  2m 15s | Max:  4m 24s
  🟩 20                 Pass: 100%/24  | Total:  1h 11m | Avg:  2m 58s | Max:  8m 57s | Hits:  82%/102

🟩 cccl: Pass: 100%/4 | Total: 17m 55s | Avg: 4m 28s | Max: 4m 55s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 17m 55s | Avg:  4m 28s | Max:  4m 55s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 19s | Avg:  4m 09s | Max:  4m 22s
  🟩 12.5               Pass: 100%/2   | Total:  9m 36s | Avg:  4m 48s | Max:  4m 55s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 19s | Avg:  4m 09s | Max:  4m 22s
  🟩 nvcc12.5           Pass: 100%/2   | Total:  9m 36s | Avg:  4m 48s | Max:  4m 55s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 17m 55s | Avg:  4m 28s | Max:  4m 55s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 22s | Avg:  4m 22s | Max:  4m 22s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 55s | Avg:  4m 55s | Max:  4m 55s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 57s | Avg:  3m 57s | Max:  3m 57s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 41s | Avg:  4m 41s | Max:  4m 41s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 17s | Avg:  4m 38s | Max:  4m 55s
  🟩 GCC                Pass: 100%/2   | Total:  8m 38s | Avg:  4m 19s | Max:  4m 41s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 17m 55s | Avg:  4m 28s | Max:  4m 55s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 17m 55s | Avg:  4m 28s | Max:  4m 55s

🟩 pycuda: Pass: 100%/1 | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 421)

#	Runner
305	`linux-amd64-cpu16`
65	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h

github-actions · 2024-08-29T03:39:23Z

🟨 CI finished in 6h 55m: Pass: 98%/421 | Total: 2d 07h | Avg: 7m 52s | Max: 56m 07s | Hits: 98%/34092

🟨 libcudacxx: Pass: 94%/112 | Total: 17h 12m | Avg: 9m 13s | Max: 37m 35s | Hits: 98%/16707

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  94%/104 | Total: 16h 03m | Avg:  9m 15s | Max: 37m 35s | Hits:  98%/16707 
  🟩 arm64              Pass: 100%/8   | Total:  1h 09m | Avg:  8m 39s | Max: 12m 22s
🟨 ctk
  🟨 11.1               Pass:  80%/15  | Total:  1h 24m | Avg:  5m 37s | Max: 18m 09s | Hits:  99%/2592  
  🟩 11.8               Pass: 100%/3   | Total: 35m 53s | Avg: 11m 57s | Max: 19m 49s
  🟨 12.5               Pass:  96%/94  | Total: 15h 12m | Avg:  9m 42s | Max: 37m 35s | Hits:  98%/14115 
🟨 cudacxx
  🟥 ClangCUDA17        Pass:   0%/2   | Total: 21m 35s | Avg: 10m 47s | Max: 18m 55s
  🟨 nvcc11.1           Pass:  80%/15  | Total:  1h 24m | Avg:  5m 37s | Max: 18m 09s | Hits:  99%/2592  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 35m 53s | Avg: 11m 57s | Max: 19m 49s
  🟨 nvcc12.5           Pass:  98%/92  | Total: 14h 50m | Avg:  9m 40s | Max: 37m 35s | Hits:  98%/14115 
🟨 cxx
  🟨 Clang9             Pass:  50%/6   | Total: 31m 21s | Avg:  5m 13s | Max: 15m 13s
  🟩 Clang10            Pass: 100%/3   | Total: 50m 20s | Avg: 16m 46s | Max: 19m 29s
  🟩 Clang11            Pass: 100%/4   | Total: 36m 02s | Avg:  9m 00s | Max: 14m 33s
  🟩 Clang12            Pass: 100%/4   | Total: 57m 43s | Avg: 14m 25s | Max: 14m 46s
  🟩 Clang13            Pass: 100%/4   | Total: 25m 48s | Avg:  6m 27s | Max: 14m 41s
  🟩 Clang14            Pass: 100%/4   | Total: 26m 37s | Avg:  6m 39s | Max: 15m 18s
  🟩 Clang15            Pass: 100%/4   | Total: 25m 54s | Avg:  6m 28s | Max: 13m 22s
  🟩 Clang16            Pass: 100%/4   | Total: 36m 24s | Avg:  9m 06s | Max: 14m 46s
  🟨 Clang17            Pass:  85%/14  | Total:  2h 55m | Avg: 12m 30s | Max: 18m 55s
  🟩 GCC6               Pass: 100%/2   | Total: 12m 51s | Avg:  6m 25s | Max: 10m 32s
  🟩 GCC7               Pass: 100%/6   | Total: 25m 31s | Avg:  4m 15s | Max: 10m 57s
  🟩 GCC8               Pass: 100%/6   | Total: 17m 09s | Avg:  2m 51s | Max:  3m 13s
  🟩 GCC9               Pass: 100%/6   | Total: 42m 53s | Avg:  7m 08s | Max: 12m 45s
  🟩 GCC10              Pass: 100%/4   | Total: 23m 45s | Avg:  5m 56s | Max: 13m 50s
  🟩 GCC11              Pass: 100%/7   | Total: 49m 36s | Avg:  7m 05s | Max: 19m 49s
  🟩 GCC12              Pass: 100%/4   | Total: 35m 10s | Avg:  8m 47s | Max: 14m 37s
  🟨 GCC13              Pass:  95%/21  | Total:  4h 17m | Avg: 12m 17s | Max: 37m 35s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 10s | Avg:  5m 03s | Max:  5m 15s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 09s | Avg: 18m 09s | Max: 18m 09s | Hits:  99%/2592  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 26m 14s | Avg: 13m 07s | Max: 13m 08s | Hits:  99%/5546  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 42m 42s | Avg: 14m 14s | Max: 16m 12s | Hits:  97%/8569  
🟨 cxx_family
  🟨 Clang              Pass:  89%/47  | Total:  7h 45m | Avg:  9m 53s | Max: 19m 29s
  🟨 GCC                Pass:  98%/56  | Total:  7h 44m | Avg:  8m 18s | Max: 37m 35s
  🟩 Intel              Pass: 100%/3   | Total: 15m 10s | Avg:  5m 03s | Max:  5m 15s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 27m | Avg: 14m 30s | Max: 18m 09s | Hits:  98%/16707 
🟨 jobs
  🟨 Build              Pass:  94%/99  | Total: 12h 48m | Avg:  7m 45s | Max: 19m 49s | Hits:  98%/16707 
  🟨 NVRTC              Pass:  75%/4   | Total:  2h 10m | Avg: 32m 38s | Max: 37m 35s
  🟩 Test               Pass: 100%/8   | Total:  2h 11m | Avg: 16m 26s | Max: 21m 00s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
🟨 gpu
  🟨 v100               Pass:  94%/112 | Total: 17h 12m | Avg:  9m 13s | Max: 37m 35s | Hits:  98%/16707 
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total: 21m 35s | Avg: 10m 47s | Max: 18m 55s
  🟨 nvcc               Pass:  96%/110 | Total: 16h 50m | Avg:  9m 11s | Max: 37m 35s | Hits:  98%/16707 
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 35m 53s | Avg: 11m 57s | Max: 19m 49s
  🟩 90a                Pass: 100%/4   | Total: 14m 26s | Avg:  3m 36s | Max:  3m 44s
🟨 std
  🟨 11                 Pass:  96%/29  | Total:  3h 31m | Avg:  7m 16s | Max: 20m 32s
  🟨 14                 Pass:  96%/32  | Total:  4h 44m | Avg:  8m 53s | Max: 35m 01s | Hits:  97%/7978  
  🟨 17                 Pass:  90%/31  | Total:  5h 24m | Avg: 10m 27s | Max: 37m 26s | Hits:  99%/5706  
  🟨 20                 Pass:  94%/19  | Total:  3h 30m | Avg: 11m 05s | Max: 37m 35s | Hits:  99%/3023

🟨 cub: Pass: 99%/131 | Total: 21h 53m | Avg: 10m 01s | Max: 51m 08s | Hits: 99%/4278

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  99%/123 | Total: 21h 18m | Avg: 10m 23s | Max: 51m 08s | Hits:  99%/4278  
  🟩 arm64              Pass: 100%/8   | Total: 34m 37s | Avg:  4m 19s | Max:  4m 44s
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 04m | Avg:  4m 18s | Max: 13m 31s | Hits:  99%/713   
  🟩 11.8               Pass: 100%/3   | Total: 13m 19s | Avg:  4m 26s | Max:  4m 38s
  🔍 12.5               Pass:  99%/113 | Total: 20h 35m | Avg: 10m 56s | Max: 51m 08s | Hits:  99%/3565  
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 29s | Avg:  3m 44s | Max:  3m 56s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 04m | Avg:  4m 18s | Max: 13m 31s | Hits:  99%/713   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 19s | Avg:  4m 26s | Max:  4m 38s
  🔍 nvcc12.5           Pass:  99%/111 | Total: 20h 28m | Avg: 11m 03s | Max: 51m 08s | Hits:  99%/3565  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 29s | Avg:  3m 44s | Max:  3m 56s
  🔍 nvcc               Pass:  99%/129 | Total: 21h 46m | Avg: 10m 07s | Max: 51m 08s | Hits:  99%/4278  
🔍 cxx: GCC13 🔍
  🟩 Clang9             Pass: 100%/6   | Total: 26m 45s | Avg:  4m 27s | Max:  5m 17s
  🟩 Clang10            Pass: 100%/3   | Total: 15m 23s | Avg:  5m 07s | Max:  5m 30s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 51s | Avg:  4m 27s | Max:  4m 38s
  🟩 Clang12            Pass: 100%/4   | Total: 17m 32s | Avg:  4m 23s | Max:  4m 32s
  🟩 Clang13            Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  4m 37s
  🟩 Clang14            Pass: 100%/4   | Total: 17m 34s | Avg:  4m 23s | Max:  4m 53s
  🟩 Clang15            Pass: 100%/4   | Total: 17m 58s | Avg:  4m 29s | Max:  4m 55s
  🟩 Clang16            Pass: 100%/4   | Total: 17m 58s | Avg:  4m 29s | Max:  4m 36s
  🟩 Clang17            Pass: 100%/26  | Total:  6h 51m | Avg: 15m 50s | Max: 39m 27s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 42s | Avg:  3m 21s | Max:  3m 23s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 10m | Avg: 11m 45s | Max: 51m 08s
  🟩 GCC8               Pass: 100%/6   | Total: 24m 07s | Avg:  4m 01s | Max:  4m 32s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 36s | Avg:  4m 06s | Max:  4m 49s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 15s | Avg:  4m 33s | Max:  4m 47s
  🟩 GCC11              Pass: 100%/7   | Total: 31m 24s | Avg:  4m 29s | Max:  4m 52s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 34s | Avg:  4m 38s | Max:  5m 02s
  🔍 GCC13              Pass:  96%/28  | Total:  7h 50m | Avg: 16m 48s | Max: 45m 52s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 12s | Avg:  5m 04s | Max:  5m 11s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 31s | Avg: 13m 31s | Max: 13m 31s | Hits:  99%/713   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 38s | Avg: 11m 49s | Max: 12m 24s | Hits:  99%/1426  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 36m 14s | Avg: 12m 04s | Max: 12m 31s | Hits:  99%/2139  
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/59  | Total:  9h 20m | Avg:  9m 29s | Max: 39m 27s
  🔍 GCC                Pass:  98%/63  | Total: 11h 04m | Avg: 10m 33s | Max: 51m 08s
  🟩 Intel              Pass: 100%/3   | Total: 15m 12s | Avg:  5m 04s | Max:  5m 11s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 13m | Avg: 12m 13s | Max: 13m 31s | Hits:  99%/4278  
🔍 jobs: HostLaunch 🔍
  🟩 Build              Pass: 100%/99  | Total:  8h 44m | Avg:  5m 18s | Max: 51m 08s | Hits:  99%/4278  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  3h 25m | Avg: 25m 44s | Max: 40m 32s
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 35m | Avg: 19m 25s | Max: 24m 28s
  🔍 HostLaunch         Pass:  87%/8   | Total:  2h 29m | Avg: 18m 38s | Max: 26m 04s
  🟩 TestGPU            Pass: 100%/8   | Total:  4h 38m | Avg: 34m 48s | Max: 45m 52s
🔍 std: 17 🔍
  🟩 11                 Pass: 100%/34  | Total:  6h 10m | Avg: 10m 54s | Max: 51m 08s
  🟩 14                 Pass: 100%/37  | Total:  5h 45m | Avg:  9m 21s | Max: 39m 27s | Hits:  99%/2139  
  🔍 17                 Pass:  97%/36  | Total:  5h 06m | Avg:  8m 30s | Max: 35m 05s | Hits:  99%/1426  
  🟩 20                 Pass: 100%/24  | Total:  4h 50m | Avg: 12m 06s | Max: 40m 32s | Hits:  99%/713   
🟨 gpu
  🟨 v100               Pass:  99%/131 | Total: 21h 53m | Avg: 10m 01s | Max: 51m 08s | Hits:  99%/4278  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 19s | Avg:  4m 26s | Max:  4m 38s
  🟩 90a                Pass: 100%/4   | Total: 14m 38s | Avg:  3m 39s | Max:  3m 47s

🟩 thrust: Pass: 100%/118 | Total: 13h 13m | Avg: 6m 43s | Max: 56m 07s | Hits: 99%/13005

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 12h 44m | Avg:  6m 56s | Max: 56m 07s | Hits:  99%/13005 
  🟩 arm64              Pass: 100%/8   | Total: 29m 28s | Avg:  3m 41s | Max:  4m 01s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 04m | Avg:  4m 16s | Max: 16m 17s | Hits:  99%/1445  
  🟩 11.8               Pass: 100%/3   | Total: 12m 34s | Avg:  4m 11s | Max:  4m 36s
  🟩 12.5               Pass: 100%/100 | Total: 11h 57m | Avg:  7m 10s | Max: 56m 07s | Hits:  99%/11560 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  8m 04s | Avg:  4m 02s | Max:  4m 05s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 04m | Avg:  4m 16s | Max: 16m 17s | Hits:  99%/1445  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 12m 34s | Avg:  4m 11s | Max:  4m 36s
  🟩 nvcc12.5           Pass: 100%/98  | Total: 11h 48m | Avg:  7m 14s | Max: 56m 07s | Hits:  99%/11560 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 04s | Avg:  4m 02s | Max:  4m 05s
  🟩 nvcc               Pass: 100%/116 | Total: 13h 05m | Avg:  6m 46s | Max: 56m 07s | Hits:  99%/13005 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 23m 33s | Avg:  3m 55s | Max:  4m 40s
  🟩 Clang10            Pass: 100%/3   | Total: 14m 47s | Avg:  4m 55s | Max:  5m 06s
  🟩 Clang11            Pass: 100%/4   | Total: 16m 17s | Avg:  4m 04s | Max:  4m 17s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 47s | Avg:  4m 11s | Max:  4m 35s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 24s | Avg:  4m 06s | Max:  4m 09s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  4m 33s
  🟩 Clang15            Pass: 100%/4   | Total: 16m 12s | Avg:  4m 03s | Max:  4m 13s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 36s | Avg:  4m 09s | Max:  4m 18s
  🟩 Clang17            Pass: 100%/18  | Total:  2h 34m | Avg:  8m 36s | Max: 26m 55s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 01s | Avg:  3m 30s | Max:  3m 35s
  🟩 GCC7               Pass: 100%/6   | Total: 21m 35s | Avg:  3m 35s | Max:  4m 08s
  🟩 GCC8               Pass: 100%/6   | Total: 22m 14s | Avg:  3m 42s | Max:  3m 58s
  🟩 GCC9               Pass: 100%/6   | Total: 21m 43s | Avg:  3m 37s | Max:  4m 20s
  🟩 GCC10              Pass: 100%/4   | Total: 15m 28s | Avg:  3m 52s | Max:  4m 05s
  🟩 GCC11              Pass: 100%/7   | Total: 29m 58s | Avg:  4m 16s | Max:  4m 40s
  🟩 GCC12              Pass: 100%/4   | Total: 17m 17s | Avg:  4m 19s | Max:  4m 45s
  🟩 GCC13              Pass: 100%/20  | Total:  3h 24m | Avg: 10m 13s | Max: 56m 07s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 30s | Avg:  5m 10s | Max:  5m 30s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 17s | Avg: 16m 17s | Max: 16m 17s | Hits:  99%/1445  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 27m 09s | Avg: 13m 34s | Max: 13m 58s | Hits:  99%/2890  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 42m | Avg: 17m 08s | Max: 20m 18s | Hits:  99%/8670  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  4h 52m | Avg:  5m 43s | Max: 26m 55s
  🟩 GCC                Pass: 100%/55  | Total:  5h 39m | Avg:  6m 10s | Max: 56m 07s
  🟩 Intel              Pass: 100%/3   | Total: 15m 30s | Avg:  5m 10s | Max:  5m 30s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 26m | Avg: 16m 14s | Max: 20m 18s | Hits:  99%/13005 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 13h 13m | Avg:  6m 43s | Max: 56m 07s | Hits:  99%/13005 
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 42m | Avg:  4m 40s | Max: 16m 17s | Hits:  99%/8670  
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 51m | Avg: 10m 09s | Max: 20m 18s | Hits:  99%/4335  
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 39m | Avg: 27m 28s | Max: 56m 07s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 12m 34s | Avg:  4m 11s | Max:  4m 36s
  🟩 90a                Pass: 100%/4   | Total: 14m 23s | Avg:  3m 35s | Max:  3m 48s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 42m | Avg:  5m 25s | Max: 25m 43s
  🟩 14                 Pass: 100%/34  | Total:  4h 24m | Avg:  7m 46s | Max: 56m 07s | Hits:  99%/5780  
  🟩 17                 Pass: 100%/33  | Total:  3h 24m | Avg:  6m 10s | Max: 23m 39s | Hits:  99%/4335  
  🟩 20                 Pass: 100%/21  | Total:  2h 42m | Avg:  7m 43s | Max: 26m 51s | Hits:  99%/2890

🟩 cudax: Pass: 100%/55 | Total: 2h 26m | Avg: 2m 39s | Max: 10m 02s | Hits: 80%/102

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 18m | Avg:  2m 43s | Max: 10m 02s | Hits:  80%/102   
  🟩 arm64              Pass: 100%/4   | Total:  7m 27s | Avg:  1m 51s | Max:  2m 24s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 03m | Avg:  2m 44s | Max: 10m 02s | Hits:  80%/51    
  🟩 12.5               Pass: 100%/32  | Total:  1h 22m | Avg:  2m 35s | Max:  8m 47s | Hits:  80%/51    
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 03m | Avg:  2m 44s | Max: 10m 02s | Hits:  80%/51    
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 22m | Avg:  2m 35s | Max:  8m 47s | Hits:  80%/51    
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 26m | Avg:  2m 39s | Max: 10m 02s | Hits:  80%/102   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 16s | Avg:  2m 08s | Max:  2m 12s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 03s | Avg:  2m 01s | Max:  2m 08s
  🟩 Clang11            Pass: 100%/4   | Total:  8m 11s | Avg:  2m 02s | Max:  2m 12s
  🟩 Clang12            Pass: 100%/4   | Total:  8m 10s | Avg:  2m 02s | Max:  2m 09s
  🟩 Clang13            Pass: 100%/4   | Total:  8m 42s | Avg:  2m 10s | Max:  2m 19s
  🟩 Clang14            Pass: 100%/6   | Total: 17m 02s | Avg:  2m 50s | Max:  4m 02s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 24s | Avg:  2m 12s | Max:  2m 15s
  🟩 Clang16            Pass: 100%/6   | Total: 17m 02s | Avg:  2m 50s | Max:  4m 00s
  🟩 GCC9               Pass: 100%/2   | Total:  3m 51s | Avg:  1m 55s | Max:  1m 58s
  🟩 GCC10              Pass: 100%/4   | Total:  8m 16s | Avg:  2m 04s | Max:  2m 29s
  🟩 GCC11              Pass: 100%/4   | Total:  9m 01s | Avg:  2m 15s | Max:  2m 44s
  🟩 GCC12              Pass: 100%/12  | Total: 31m 38s | Avg:  2m 38s | Max:  4m 21s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 10m 02s | Avg: 10m 02s | Max: 10m 02s | Hits:  80%/51    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 47s | Avg:  8m 47s | Max:  8m 47s | Hits:  80%/51    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 11m | Avg:  2m 23s | Max:  4m 02s
  🟩 GCC                Pass: 100%/22  | Total: 52m 46s | Avg:  2m 23s | Max:  4m 21s
  🟩 Intel              Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s
  🟩 MSVC               Pass: 100%/2   | Total: 18m 49s | Avg:  9m 24s | Max: 10m 02s | Hits:  80%/102   
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 26m | Avg:  2m 39s | Max: 10m 02s | Hits:  80%/102   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  1h 54m | Avg:  2m 26s | Max: 10m 02s | Hits:  80%/102   
  🟩 Test               Pass: 100%/8   | Total: 31m 50s | Avg:  3m 58s | Max:  4m 21s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 15s | Avg:  2m 15s | Max:  2m 15s
  🟩 90a                Pass: 100%/1   | Total:  1m 56s | Avg:  1m 56s | Max:  1m 56s
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 15m | Avg:  2m 25s | Max:  4m 04s
  🟩 20                 Pass: 100%/24  | Total:  1h 11m | Avg:  2m 57s | Max: 10m 02s | Hits:  80%/102

🟩 cccl: Pass: 100%/4 | Total: 17m 27s | Avg: 4m 21s | Max: 4m 31s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  4m 31s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 37s | Avg:  4m 18s | Max:  4m 28s
  🟩 12.5               Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 31s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 37s | Avg:  4m 18s | Max:  4m 28s
  🟩 nvcc12.5           Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 31s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  4m 31s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 GCC6               Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 19s | Avg:  4m 19s | Max:  4m 19s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  8m 59s | Avg:  4m 29s | Max:  4m 31s
  🟩 GCC                Pass: 100%/2   | Total:  8m 28s | Avg:  4m 14s | Max:  4m 19s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  4m 31s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  4m 31s

🟩 pycuda: Pass: 100%/1 | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 421)

#	Runner
305	`linux-amd64-cpu16`
65	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

github-actions · 2024-09-11T06:13:58Z

🟨 CI finished in 12h 23m: Pass: 95%/437 | Total: 2d 22h | Avg: 9m 40s | Max: 59m 39s | Hits: 97%/41584

🟨 libcudacxx: Pass: 83%/116 | Total: 1d 09h | Avg: 17m 09s | Max: 59m 39s | Hits: 95%/16941

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  82%/108 | Total:  1d 07h | Avg: 17m 14s | Max: 59m 39s | Hits:  95%/16941 
  🟩 arm64              Pass: 100%/8   | Total:  2h 09m | Avg: 16m 09s | Max: 22m 27s
🔍 jobs: Build 🔍
  🔍 Build              Pass:  81%/103 | Total:  1d 03h | Avg: 16m 02s | Max: 23m 12s | Hits:  95%/16941 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 26m | Avg: 21m 32s | Max: 25m 25s
  🟩 Test               Pass: 100%/8   | Total:  4h 10m | Avg: 31m 16s | Max: 59m 39s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 05s | Avg:  2m 05s | Max:  2m 05s
🚨 sm: 60;70;80;90 🚨
  🔥 60;70;80;90        Pass:   0%/3   | Total: 56m 08s | Avg: 18m 42s | Max: 20m 41s
  🟩 90a                Pass: 100%/4   | Total: 38m 58s | Avg:  9m 44s | Max: 10m 35s
🟨 cudacxx
  🟥 ClangCUDA18        Pass:   0%/2   | Total: 37m 00s | Avg: 18m 30s | Max: 19m 08s
  🟨 nvcc11.1           Pass:   6%/15  | Total:  3h 00m | Avg: 12m 02s | Max: 23m 12s | Hits:  97%/2631  
  🟥 nvcc11.8           Pass:   0%/3   | Total: 56m 08s | Avg: 18m 42s | Max: 20m 41s
  🟩 nvcc12.6           Pass: 100%/96  | Total:  1d 04h | Avg: 17m 53s | Max: 59m 39s | Hits:  95%/14310 
🟨 cxx
  🟨 Clang9             Pass:  50%/6   | Total:  1h 04m | Avg: 10m 48s | Max: 20m 01s
  🟩 Clang10            Pass: 100%/3   | Total: 57m 35s | Avg: 19m 11s | Max: 21m 52s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 10m | Avg: 17m 35s | Max: 22m 01s
  🟩 Clang12            Pass: 100%/4   | Total:  1h 07m | Avg: 16m 50s | Max: 18m 40s
  🟩 Clang13            Pass: 100%/4   | Total:  1h 07m | Avg: 16m 59s | Max: 20m 00s
  🟩 Clang14            Pass: 100%/4   | Total: 58m 30s | Avg: 14m 37s | Max: 14m 51s
  🟩 Clang15            Pass: 100%/4   | Total:  1h 07m | Avg: 16m 46s | Max: 20m 22s
  🟩 Clang16            Pass: 100%/4   | Total:  1h 07m | Avg: 16m 54s | Max: 19m 48s
  🟩 Clang17            Pass: 100%/4   | Total:  1h 16m | Avg: 19m 06s | Max: 21m 37s
  🟨 Clang18            Pass:  85%/14  | Total:  4h 21m | Avg: 18m 40s | Max: 28m 54s
  🟥 GCC6               Pass:   0%/2   | Total: 23m 29s | Avg: 11m 44s | Max: 12m 11s
  🟨 GCC7               Pass:  50%/6   | Total:  1h 47m | Avg: 17m 52s | Max: 23m 12s
  🟨 GCC8               Pass:  50%/6   | Total:  1h 36m | Avg: 16m 00s | Max: 20m 27s
  🟨 GCC9               Pass:  50%/6   | Total:  1h 36m | Avg: 16m 09s | Max: 22m 17s
  🟩 GCC10              Pass: 100%/4   | Total:  1h 06m | Avg: 16m 42s | Max: 18m 48s
  🟨 GCC11              Pass:  57%/7   | Total:  2h 02m | Avg: 17m 34s | Max: 20m 41s
  🟩 GCC12              Pass: 100%/4   | Total:  1h 11m | Avg: 17m 47s | Max: 20m 27s
  🟩 GCC13              Pass: 100%/21  | Total:  6h 43m | Avg: 19m 12s | Max: 59m 39s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 01m | Avg: 20m 22s | Max: 21m 32s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 41s | Avg: 16m 41s | Max: 16m 41s | Hits:  97%/2631  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 28m 02s | Avg: 14m 01s | Max: 16m 44s | Hits:  91%/5624  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 37m 20s | Avg: 12m 26s | Max: 13m 14s | Hits:  97%/8686  
🟨 cxx_family
  🟨 Clang              Pass:  90%/51  | Total: 14h 19m | Avg: 16m 50s | Max: 28m 54s
  🟨 GCC                Pass:  75%/56  | Total: 16h 28m | Avg: 17m 38s | Max: 59m 39s
  🟩 Intel              Pass: 100%/3   | Total:  1h 01m | Avg: 20m 22s | Max: 21m 32s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 22m | Avg: 13m 40s | Max: 16m 44s | Hits:  95%/16941 
🟨 gpu
  🟨 v100               Pass:  83%/116 | Total:  1d 09h | Avg: 17m 09s | Max: 59m 39s | Hits:  95%/16941 
🟨 ctk
  🟨 11.1               Pass:   6%/15  | Total:  3h 00m | Avg: 12m 02s | Max: 23m 12s | Hits:  97%/2631  
  🟥 11.8               Pass:   0%/3   | Total: 56m 08s | Avg: 18m 42s | Max: 20m 41s
  🟨 12.6               Pass:  97%/98  | Total:  1d 05h | Avg: 17m 53s | Max: 59m 39s | Hits:  95%/14310 
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total: 37m 00s | Avg: 18m 30s | Max: 19m 08s
  🟨 nvcc               Pass:  85%/114 | Total:  1d 08h | Avg: 17m 08s | Max: 59m 39s | Hits:  95%/16941 
🟨 std
  🟨 11                 Pass:  80%/30  | Total:  8h 45m | Avg: 17m 30s | Max: 23m 53s
  🟨 14                 Pass:  81%/33  | Total:  8h 32m | Avg: 15m 30s | Max: 26m 47s | Hits:  93%/8095  
  🟨 17                 Pass:  81%/32  | Total:  9h 41m | Avg: 18m 09s | Max: 59m 39s | Hits:  97%/5784  
  🟨 20                 Pass:  95%/20  | Total:  6h 10m | Avg: 18m 30s | Max: 43m 53s | Hits:  97%/3062

🟩 cub: Pass: 100%/136 | Total: 20h 41m | Avg: 9m 07s | Max: 43m 24s | Hits: 99%/4362

🟩 cpu
  🟩 amd64              Pass: 100%/128 | Total: 20h 00m | Avg:  9m 22s | Max: 43m 24s | Hits:  99%/4362  
  🟩 arm64              Pass: 100%/8   | Total: 40m 11s | Avg:  5m 01s | Max:  5m 45s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 43m | Avg:  6m 52s | Max: 43m 24s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 15m 38s | Avg:  5m 12s | Max:  5m 52s
  🟩 12.6               Pass: 100%/118 | Total: 18h 42m | Avg:  9m 30s | Max: 36m 13s | Hits:  99%/3635  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 08s | Avg:  4m 04s | Max:  4m 12s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 43m | Avg:  6m 52s | Max: 43m 24s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 38s | Avg:  5m 12s | Max:  5m 52s
  🟩 nvcc12.6           Pass: 100%/116 | Total: 18h 34m | Avg:  9m 36s | Max: 36m 13s | Hits:  99%/3635  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 08s | Avg:  4m 04s | Max:  4m 12s
  🟩 nvcc               Pass: 100%/134 | Total: 20h 32m | Avg:  9m 12s | Max: 43m 24s | Hits:  99%/4362  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 29m 45s | Avg:  4m 57s | Max:  6m 17s
  🟩 Clang10            Pass: 100%/3   | Total: 18m 01s | Avg:  6m 00s | Max:  6m 12s
  🟩 Clang11            Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 33s
  🟩 Clang12            Pass: 100%/4   | Total: 21m 49s | Avg:  5m 27s | Max:  5m 42s
  🟩 Clang13            Pass: 100%/4   | Total: 21m 38s | Avg:  5m 24s | Max:  5m 40s
  🟩 Clang14            Pass: 100%/4   | Total: 21m 52s | Avg:  5m 28s | Max:  5m 48s
  🟩 Clang15            Pass: 100%/4   | Total: 21m 24s | Avg:  5m 21s | Max:  5m 49s
  🟩 Clang16            Pass: 100%/4   | Total: 22m 00s | Avg:  5m 30s | Max:  5m 43s
  🟩 Clang17            Pass: 100%/4   | Total: 21m 55s | Avg:  5m 28s | Max:  5m 40s
  🟩 Clang18            Pass: 100%/26  | Total:  5h 49m | Avg: 13m 26s | Max: 26m 38s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 26s
  🟩 GCC7               Pass: 100%/6   | Total: 26m 28s | Avg:  4m 24s | Max:  5m 32s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 05m | Avg: 10m 56s | Max: 43m 24s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 34s | Avg:  4m 25s | Max:  6m 05s
  🟩 GCC10              Pass: 100%/4   | Total: 22m 24s | Avg:  5m 36s | Max:  6m 00s
  🟩 GCC11              Pass: 100%/7   | Total: 37m 07s | Avg:  5m 18s | Max:  5m 52s
  🟩 GCC12              Pass: 100%/4   | Total: 22m 20s | Avg:  5m 35s | Max:  6m 03s
  🟩 GCC13              Pass: 100%/29  | Total:  6h 40m | Avg: 13m 49s | Max: 36m 13s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 49s | Avg:  6m 16s | Max:  6m 27s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 12m 37s | Avg: 12m 37s | Max: 12m 37s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 19m 34s | Avg:  9m 47s | Max:  9m 47s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 32m 24s | Avg: 10m 48s | Max: 11m 11s | Hits:  99%/2181  
🟩 cxx_family
  🟩 Clang              Pass: 100%/63  | Total:  9h 09m | Avg:  8m 43s | Max: 26m 38s
  🟩 GCC                Pass: 100%/64  | Total: 10h 08m | Avg:  9m 30s | Max: 43m 24s
  🟩 Intel              Pass: 100%/3   | Total: 18m 49s | Avg:  6m 16s | Max:  6m 27s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 04m | Avg: 10m 45s | Max: 12m 37s | Hits:  99%/4362  
🟩 gpu
  🟩 v100               Pass: 100%/136 | Total: 20h 41m | Avg:  9m 07s | Max: 43m 24s | Hits:  99%/4362  
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  9h 58m | Avg:  5m 48s | Max: 43m 24s | Hits:  99%/4362  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  2h 23m | Avg: 17m 57s | Max: 19m 21s
  🟩 GraphCapture       Pass: 100%/8   | Total:  1h 56m | Avg: 14m 32s | Max: 15m 58s
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 20m | Avg: 17m 31s | Max: 20m 11s
  🟩 SmallGMem          Pass: 100%/1   | Total: 30m 57s | Avg: 30m 57s | Max: 30m 57s
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 31m | Avg: 26m 27s | Max: 36m 13s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 38s | Avg:  5m 12s | Max:  5m 52s
  🟩 90a                Pass: 100%/4   | Total: 16m 50s | Avg:  4m 12s | Max:  4m 28s
🟩 std
  🟩 11                 Pass: 100%/35  | Total:  4h 32m | Avg:  7m 47s | Max: 25m 01s
  🟩 14                 Pass: 100%/38  | Total:  5h 25m | Avg:  8m 34s | Max: 36m 13s | Hits:  99%/2181  
  🟩 17                 Pass: 100%/38  | Total:  6h 24m | Avg: 10m 06s | Max: 43m 24s | Hits:  99%/1454  
  🟩 20                 Pass: 100%/25  | Total:  4h 18m | Avg: 10m 20s | Max: 27m 49s | Hits:  99%/727

🟩 thrust: Pass: 100%/122 | Total: 13h 12m | Avg: 6m 29s | Max: 21m 48s | Hits: 99%/20079

🟩 cpu
  🟩 amd64              Pass: 100%/114 | Total: 12h 37m | Avg:  6m 38s | Max: 21m 48s | Hits:  99%/20079 
  🟩 arm64              Pass: 100%/8   | Total: 35m 14s | Avg:  4m 24s | Max:  4m 52s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 10m | Avg:  4m 40s | Max: 16m 34s | Hits:  99%/2231  
  🟩 11.8               Pass: 100%/3   | Total: 13m 39s | Avg:  4m 33s | Max:  4m 43s
  🟩 12.6               Pass: 100%/104 | Total: 11h 48m | Avg:  6m 48s | Max: 21m 48s | Hits:  99%/17848 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 29s | Avg:  4m 44s | Max:  4m 52s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 10m | Avg:  4m 40s | Max: 16m 34s | Hits:  99%/2231  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 39s | Avg:  4m 33s | Max:  4m 43s
  🟩 nvcc12.6           Pass: 100%/102 | Total: 11h 39m | Avg:  6m 51s | Max: 21m 48s | Hits:  99%/17848 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 29s | Avg:  4m 44s | Max:  4m 52s
  🟩 nvcc               Pass: 100%/120 | Total: 13h 03m | Avg:  6m 31s | Max: 21m 48s | Hits:  99%/20079 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 30m 06s | Avg:  5m 01s | Max:  6m 15s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 40s | Avg:  5m 53s | Max:  6m 13s
  🟩 Clang11            Pass: 100%/4   | Total: 19m 04s | Avg:  4m 46s | Max:  5m 01s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 39s | Avg:  4m 39s | Max:  4m 59s
  🟩 Clang13            Pass: 100%/4   | Total: 20m 25s | Avg:  5m 06s | Max:  5m 24s
  🟩 Clang14            Pass: 100%/4   | Total: 20m 14s | Avg:  5m 03s | Max:  5m 23s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 47s | Avg:  4m 56s | Max:  5m 10s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 20s | Avg:  4m 35s | Max:  4m 51s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 20s | Avg:  4m 50s | Max:  5m 13s
  🟩 Clang18            Pass: 100%/18  | Total:  2h 19m | Avg:  7m 44s | Max: 21m 34s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 53s | Avg:  3m 26s | Max:  3m 40s
  🟩 GCC7               Pass: 100%/6   | Total: 23m 32s | Avg:  3m 55s | Max:  4m 34s
  🟩 GCC8               Pass: 100%/6   | Total: 25m 06s | Avg:  4m 11s | Max:  4m 53s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 00s | Avg:  4m 20s | Max:  5m 08s
  🟩 GCC10              Pass: 100%/4   | Total: 19m 02s | Avg:  4m 45s | Max:  5m 05s
  🟩 GCC11              Pass: 100%/7   | Total: 33m 37s | Avg:  4m 48s | Max:  5m 31s
  🟩 GCC12              Pass: 100%/4   | Total: 20m 17s | Avg:  5m 04s | Max:  5m 59s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 28m | Avg:  7m 24s | Max: 21m 19s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 31s | Avg:  6m 10s | Max:  6m 32s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 34s | Avg: 16m 34s | Max: 16m 34s | Hits:  99%/2231  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 27m 54s | Avg: 13m 57s | Max: 14m 28s | Hits:  99%/4462  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 44m | Avg: 17m 20s | Max: 21m 48s | Hits:  99%/13386 
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  5h 22m | Avg:  5m 52s | Max: 21m 34s
  🟩 GCC                Pass: 100%/55  | Total:  5h 02m | Avg:  5m 30s | Max: 21m 19s
  🟩 Intel              Pass: 100%/3   | Total: 18m 31s | Avg:  6m 10s | Max:  6m 32s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 28m | Avg: 16m 29s | Max: 21m 48s | Hits:  99%/20079 
🟩 gpu
  🟩 v100               Pass: 100%/122 | Total: 13h 12m | Avg:  6m 29s | Max: 21m 48s | Hits:  99%/20079 
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  9h 05m | Avg:  5m 17s | Max: 16m 34s | Hits:  99%/13386 
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 53m | Avg: 10m 20s | Max: 21m 48s | Hits:  99%/6693  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 13m | Avg: 16m 38s | Max: 21m 34s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 39s | Avg:  4m 33s | Max:  4m 43s
  🟩 90a                Pass: 100%/4   | Total: 15m 38s | Avg:  3m 54s | Max:  4m 04s
🟩 std
  🟩 11                 Pass: 100%/31  | Total:  2h 37m | Avg:  5m 04s | Max: 14m 22s
  🟩 14                 Pass: 100%/35  | Total:  3h 56m | Avg:  6m 45s | Max: 17m 47s | Hits:  99%/8924  
  🟩 17                 Pass: 100%/34  | Total:  3h 58m | Avg:  7m 01s | Max: 21m 48s | Hits:  99%/6693  
  🟩 20                 Pass: 100%/22  | Total:  2h 40m | Avg:  7m 17s | Max: 21m 19s | Hits:  99%/4462

🟩 cudax: Pass: 100%/58 | Total: 2h 49m | Avg: 2m 54s | Max: 8m 28s | Hits: 56%/202

🟩 cpu
  🟩 amd64              Pass: 100%/54  | Total:  2h 39m | Avg:  2m 56s | Max:  8m 28s | Hits:  56%/202   
  🟩 arm64              Pass: 100%/4   | Total:  9m 49s | Avg:  2m 27s | Max:  2m 49s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 07m | Avg:  2m 56s | Max:  8m 10s | Hits:  56%/101   
  🟩 12.6               Pass: 100%/35  | Total:  1h 41m | Avg:  2m 54s | Max:  8m 28s | Hits:  56%/101   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 07m | Avg:  2m 56s | Max:  8m 10s | Hits:  56%/101   
  🟩 nvcc12.6           Pass: 100%/35  | Total:  1h 41m | Avg:  2m 54s | Max:  8m 28s | Hits:  56%/101   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/58  | Total:  2h 49m | Avg:  2m 54s | Max:  8m 28s | Hits:  56%/202   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  5m 05s | Avg:  2m 32s | Max:  2m 41s
  🟩 Clang10            Pass: 100%/2   | Total:  5m 04s | Avg:  2m 32s | Max:  2m 34s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 37s | Avg:  2m 24s | Max:  2m 30s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 20s | Avg:  2m 20s | Max:  2m 23s
  🟩 Clang13            Pass: 100%/4   | Total: 10m 28s | Avg:  2m 37s | Max:  2m 46s
  🟩 Clang14            Pass: 100%/6   | Total: 19m 13s | Avg:  3m 12s | Max:  4m 29s
  🟩 Clang15            Pass: 100%/2   | Total:  5m 04s | Avg:  2m 32s | Max:  2m 34s
  🟩 Clang16            Pass: 100%/4   | Total: 10m 55s | Avg:  2m 43s | Max:  2m 49s
  🟩 Clang17            Pass: 100%/2   | Total:  5m 21s | Avg:  2m 40s | Max:  2m 50s
  🟩 Clang18            Pass: 100%/4   | Total: 13m 55s | Avg:  3m 28s | Max:  4m 37s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 28s | Avg:  2m 14s | Max:  2m 24s
  🟩 GCC10              Pass: 100%/4   | Total:  9m 39s | Avg:  2m 24s | Max:  2m 42s
  🟩 GCC11              Pass: 100%/4   | Total:  9m 31s | Avg:  2m 22s | Max:  2m 40s
  🟩 GCC12              Pass: 100%/9   | Total: 28m 12s | Avg:  3m 08s | Max:  3m 58s
  🟩 GCC13              Pass: 100%/3   | Total:  6m 36s | Avg:  2m 12s | Max:  2m 14s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 10s | Avg:  8m 10s | Max:  8m 10s | Hits:  56%/101   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 28s | Avg:  8m 28s | Max:  8m 28s | Hits:  56%/101   
🟩 cxx_family
  🟩 Clang              Pass: 100%/34  | Total:  1h 34m | Avg:  2m 45s | Max:  4m 37s
  🟩 GCC                Pass: 100%/22  | Total: 58m 26s | Avg:  2m 39s | Max:  3m 58s
  🟩 MSVC               Pass: 100%/2   | Total: 16m 38s | Avg:  8m 19s | Max:  8m 28s | Hits:  56%/202   
🟩 gpu
  🟩 v100               Pass: 100%/58  | Total:  2h 49m | Avg:  2m 54s | Max:  8m 28s | Hits:  56%/202   
🟩 jobs
  🟩 Build              Pass: 100%/50  | Total:  2h 16m | Avg:  2m 43s | Max:  8m 28s | Hits:  56%/202   
  🟩 Test               Pass: 100%/8   | Total: 32m 57s | Avg:  4m 07s | Max:  4m 37s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
  🟩 90a                Pass: 100%/1   | Total:  2m 13s | Avg:  2m 13s | Max:  2m 13s
🟩 std
  🟩 17                 Pass: 100%/32  | Total:  1h 25m | Avg:  2m 40s | Max:  4m 29s
  🟩 20                 Pass: 100%/26  | Total:  1h 23m | Avg:  3m 12s | Max:  8m 28s | Hits:  56%/202

🟩 cccl: Pass: 100%/4 | Total: 17m 21s | Avg: 4m 20s | Max: 4m 57s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 17m 21s | Avg:  4m 20s | Max:  4m 57s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 58s | Avg:  3m 59s | Max:  4m 06s
  🟩 12.6               Pass: 100%/2   | Total:  9m 23s | Avg:  4m 41s | Max:  4m 57s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 58s | Avg:  3m 59s | Max:  4m 06s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 23s | Avg:  4m 41s | Max:  4m 57s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 17m 21s | Avg:  4m 20s | Max:  4m 57s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 57s | Avg:  4m 57s | Max:  4m 57s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 52s | Avg:  3m 52s | Max:  3m 52s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 26s | Avg:  4m 26s | Max:  4m 26s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 03s | Avg:  4m 31s | Max:  4m 57s
  🟩 GCC                Pass: 100%/2   | Total:  8m 18s | Avg:  4m 09s | Max:  4m 26s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 17m 21s | Avg:  4m 20s | Max:  4m 57s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 17m 21s | Avg:  4m 20s | Max:  4m 57s

🟩 pycuda: Pass: 100%/1 | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 437)

#	Runner
320	`linux-amd64-cpu16`
66	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

gonzalobg · 2024-09-11T11:30:22Z

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h

+  __dst = __cuda_atomic_fetch_update(
+    __ptr,
+    [__op](_Type __old) {
+      return __old < __op ? __old : __op;


I think that, in general (not sure what _Types we support here as an extension):

fetch_min(op) should be: op < old? op : old, since assuming old (the value in memory aka "the atomic objects value") is the "first argument", std::min requires the first argument (old) to be returned when the arguments compare equivalent.

For a similar reason, fetch_max(op) should be: old < op? op : old.

@miscco @bernhardmgruber may know the details.

I am slightly concerned about changing runtime behavior, but on the other hand that is the more correct one

gonzalobg · 2024-09-11T11:34:35Z

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h

+static inline _CCCL_DEVICE void
+__cuda_atomic_store(_Type* __ptr, _Type __val, _Order, _Operand, _Sco, __atomic_cuda_mmio_disable)
+{
+  // Store requires cas on 8/16b types


Why does store require cas on 8 and 16b types?

PTX atomic store (st.relaxed,st.release) supports .b8,.u8,.s8,.b16,.u16,.s16:
https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#data-movement-and-conversion-instructions-st

I assumed emulation for load and store. More poignantly, there is no PTX constraint for 8b values. I'll evaluate using 16b ld/st.

I've updated the PR to use 16b ld/st. To make use of 8b we'd need to dispatch to assembly that uses a widened proxy for output/input. That will require adjustments that I don't want to add into this PR. We can do it later.

More poignantly, there is no PTX constraint for 8b values.

Right, libcu++ needs to zero extend the 8-bit value to a 16 bit value, pass the 16-bit value to PTX, and then directly pass that to the 8byte load/store ops. Doing it later is fine.

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h

github-actions · 2024-09-12T01:40:04Z

🟨 CI finished in 3h 50m: Pass: 99%/437 | Total: 2d 22h | Avg: 9m 41s | Max: 1h 20m | Hits: 90%/41584

🟨 libcudacxx: Pass: 98%/116 | Total: 1d 07h | Avg: 16m 19s | Max: 52m 31s | Hits: 79%/16941

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  98%/108 | Total:  1d 05h | Avg: 16m 35s | Max: 52m 31s | Hits:  79%/16941 
  🟩 arm64              Pass: 100%/8   | Total:  1h 41m | Avg: 12m 43s | Max: 14m 43s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/15  | Total:  3h 45m | Avg: 15m 02s | Max: 21m 50s | Hits:  98%/2631  
  🟩 11.8               Pass: 100%/3   | Total: 58m 40s | Avg: 19m 33s | Max: 20m 59s
  🔍 12.6               Pass:  97%/98  | Total:  1d 02h | Avg: 16m 25s | Max: 52m 31s | Hits:  75%/14310 
🚨 cudacxx: ClangCUDA18 🚨
  🔥 ClangCUDA18        Pass:   0%/2   | Total: 39m 32s | Avg: 19m 46s | Max: 19m 53s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 45m | Avg: 15m 02s | Max: 21m 50s | Hits:  98%/2631  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 58m 40s | Avg: 19m 33s | Max: 20m 59s
  🟩 nvcc12.6           Pass: 100%/96  | Total:  1d 02h | Avg: 16m 21s | Max: 52m 31s | Hits:  75%/14310 
🚨 cudacxx_family: ClangCUDA 🚨
  🔥 ClangCUDA          Pass:   0%/2   | Total: 39m 32s | Avg: 19m 46s | Max: 19m 53s
  🟩 nvcc               Pass: 100%/114 | Total:  1d 06h | Avg: 16m 16s | Max: 52m 31s | Hits:  79%/16941 
🔍 cxx: Clang18 🔍
  🟩 Clang9             Pass: 100%/6   | Total:  1h 39m | Avg: 16m 36s | Max: 21m 50s
  🟩 Clang10            Pass: 100%/3   | Total: 47m 18s | Avg: 15m 46s | Max: 19m 01s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 08m | Avg: 17m 10s | Max: 18m 20s
  🟩 Clang12            Pass: 100%/4   | Total: 59m 41s | Avg: 14m 55s | Max: 15m 48s
  🟩 Clang13            Pass: 100%/4   | Total:  1h 05m | Avg: 16m 16s | Max: 19m 20s
  🟩 Clang14            Pass: 100%/4   | Total:  1h 01m | Avg: 15m 24s | Max: 19m 11s
  🟩 Clang15            Pass: 100%/4   | Total: 59m 04s | Avg: 14m 46s | Max: 17m 37s
  🟩 Clang16            Pass: 100%/4   | Total: 57m 00s | Avg: 14m 15s | Max: 15m 20s
  🟩 Clang17            Pass: 100%/4   | Total: 56m 29s | Avg: 14m 07s | Max: 15m 07s
  🔍 Clang18            Pass:  85%/14  | Total:  4h 06m | Avg: 17m 36s | Max: 34m 23s
  🟩 GCC6               Pass: 100%/2   | Total: 22m 13s | Avg: 11m 06s | Max: 12m 06s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 24m | Avg: 14m 05s | Max: 20m 51s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 24m | Avg: 14m 05s | Max: 21m 36s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 28m | Avg: 14m 46s | Max: 20m 32s
  🟩 GCC10              Pass: 100%/4   | Total: 56m 35s | Avg: 14m 08s | Max: 16m 28s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 57m | Avg: 16m 49s | Max: 20m 59s
  🟩 GCC12              Pass: 100%/4   | Total:  1h 02m | Avg: 15m 35s | Max: 19m 23s
  🟩 GCC13              Pass: 100%/21  | Total:  6h 24m | Avg: 18m 18s | Max: 52m 31s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 48m 14s | Avg: 16m 04s | Max: 17m 58s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 17m 02s | Avg: 17m 02s | Max: 17m 02s | Hits:  98%/2631  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 46m 47s | Avg: 23m 23s | Max: 34m 17s | Hits:  69%/5624  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 59m 54s | Avg: 19m 58s | Max: 34m 56s | Hits:  79%/8686  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  96%/51  | Total: 13h 41m | Avg: 16m 06s | Max: 34m 23s
  🟩 GCC                Pass: 100%/56  | Total: 15h 01m | Avg: 16m 05s | Max: 52m 31s
  🟩 Intel              Pass: 100%/3   | Total: 48m 14s | Avg: 16m 04s | Max: 17m 58s
  🟩 MSVC               Pass: 100%/6   | Total:  2h 03m | Avg: 20m 37s | Max: 34m 56s | Hits:  79%/16941 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  98%/103 | Total:  1d 01h | Avg: 15m 05s | Max: 34m 56s | Hits:  79%/16941 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 33m | Avg: 23m 22s | Max: 28m 13s
  🟩 Test               Pass: 100%/8   | Total:  4h 03m | Avg: 30m 27s | Max: 52m 31s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
🟨 std
  🟩 11                 Pass: 100%/30  | Total:  8h 03m | Avg: 16m 06s | Max: 25m 51s
  🟩 14                 Pass: 100%/33  | Total:  8h 25m | Avg: 15m 19s | Max: 32m 18s | Hits:  98%/8095  
  🟨 17                 Pass:  96%/32  | Total:  9h 18m | Avg: 17m 28s | Max: 34m 56s | Hits:  41%/5784  
  🟨 20                 Pass:  95%/20  | Total:  5h 44m | Avg: 17m 12s | Max: 52m 31s | Hits:  98%/3062  
🟨 gpu
  🟨 v100               Pass:  98%/116 | Total:  1d 07h | Avg: 16m 19s | Max: 52m 31s | Hits:  79%/16941 
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 58m 40s | Avg: 19m 33s | Max: 20m 59s
  🟩 90a                Pass: 100%/4   | Total: 37m 45s | Avg:  9m 26s | Max:  9m 59s

🟩 cub: Pass: 100%/136 | Total: 22h 15m | Avg: 9m 49s | Max: 1h 20m | Hits: 99%/4362

🟩 cpu
  🟩 amd64              Pass: 100%/128 | Total: 21h 33m | Avg: 10m 06s | Max:  1h 20m | Hits:  99%/4362  
  🟩 arm64              Pass: 100%/8   | Total: 42m 01s | Avg:  5m 15s | Max:  5m 50s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 01m | Avg:  4m 05s | Max: 11m 48s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 15m 00s | Avg:  5m 00s | Max:  5m 10s
  🟩 12.6               Pass: 100%/118 | Total: 20h 59m | Avg: 10m 40s | Max:  1h 20m | Hits:  99%/3635  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 04s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 01m | Avg:  4m 05s | Max: 11m 48s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 00s | Avg:  5m 00s | Max:  5m 10s
  🟩 nvcc12.6           Pass: 100%/116 | Total: 20h 51m | Avg: 10m 47s | Max:  1h 20m | Hits:  99%/3635  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 04s
  🟩 nvcc               Pass: 100%/134 | Total: 22h 07m | Avg:  9m 54s | Max:  1h 20m | Hits:  99%/4362  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 28m 03s | Avg:  4m 40s | Max:  6m 06s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 05s | Avg:  5m 41s | Max:  5m 55s
  🟩 Clang11            Pass: 100%/4   | Total: 20m 43s | Avg:  5m 10s | Max:  5m 15s
  🟩 Clang12            Pass: 100%/4   | Total: 20m 37s | Avg:  5m 09s | Max:  5m 17s
  🟩 Clang13            Pass: 100%/4   | Total: 21m 02s | Avg:  5m 15s | Max:  5m 25s
  🟩 Clang14            Pass: 100%/4   | Total: 21m 19s | Avg:  5m 19s | Max:  5m 40s
  🟩 Clang15            Pass: 100%/4   | Total: 20m 41s | Avg:  5m 10s | Max:  5m 13s
  🟩 Clang16            Pass: 100%/4   | Total: 21m 08s | Avg:  5m 17s | Max:  5m 36s
  🟩 Clang17            Pass: 100%/4   | Total: 20m 55s | Avg:  5m 13s | Max:  5m 37s
  🟩 Clang18            Pass: 100%/26  | Total:  6h 32m | Avg: 15m 06s | Max: 33m 11s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 04s | Avg:  3m 32s | Max:  3m 37s
  🟩 GCC7               Pass: 100%/6   | Total: 25m 53s | Avg:  4m 18s | Max:  5m 16s
  🟩 GCC8               Pass: 100%/6   | Total: 26m 16s | Avg:  4m 22s | Max:  5m 27s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 41s | Avg:  4m 26s | Max:  5m 28s
  🟩 GCC10              Pass: 100%/4   | Total: 20m 48s | Avg:  5m 12s | Max:  5m 39s
  🟩 GCC11              Pass: 100%/7   | Total: 36m 49s | Avg:  5m 15s | Max:  5m 50s
  🟩 GCC12              Pass: 100%/4   | Total: 21m 38s | Avg:  5m 24s | Max:  5m 37s
  🟩 GCC13              Pass: 100%/29  | Total:  8h 25m | Avg: 17m 26s | Max:  1h 20m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 54s | Avg:  6m 18s | Max:  6m 26s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 11m 48s | Avg: 11m 48s | Max: 11m 48s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 18m 27s | Avg:  9m 13s | Max:  9m 15s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 31m 33s | Avg: 10m 31s | Max: 11m 54s | Hits:  99%/2181  
🟩 cxx_family
  🟩 Clang              Pass: 100%/63  | Total:  9h 44m | Avg:  9m 16s | Max: 33m 11s
  🟩 GCC                Pass: 100%/64  | Total: 11h 10m | Avg: 10m 29s | Max:  1h 20m
  🟩 Intel              Pass: 100%/3   | Total: 18m 54s | Avg:  6m 18s | Max:  6m 26s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 01m | Avg: 10m 18s | Max: 11m 54s | Hits:  99%/4362  
🟩 gpu
  🟩 v100               Pass: 100%/136 | Total: 22h 15m | Avg:  9m 49s | Max:  1h 20m | Hits:  99%/4362  
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  9h 08m | Avg:  5m 19s | Max: 11m 54s | Hits:  99%/4362  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  3h 48m | Avg: 28m 36s | Max:  1h 20m
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 16m | Avg: 17m 01s | Max: 19m 35s
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 44m | Avg: 20m 33s | Max: 27m 23s
  🟩 SmallGMem          Pass: 100%/1   | Total: 34m 43s | Avg: 34m 43s | Max: 34m 43s
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 43m | Avg: 27m 55s | Max: 34m 56s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 00s | Avg:  5m 00s | Max:  5m 10s
  🟩 90a                Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 30s
🟩 std
  🟩 11                 Pass: 100%/35  | Total:  5h 58m | Avg: 10m 15s | Max:  1h 20m
  🟩 14                 Pass: 100%/38  | Total:  5h 24m | Avg:  8m 31s | Max: 30m 39s | Hits:  99%/2181  
  🟩 17                 Pass: 100%/38  | Total:  6h 18m | Avg:  9m 58s | Max: 34m 43s | Hits:  99%/1454  
  🟩 20                 Pass: 100%/25  | Total:  4h 33m | Avg: 10m 57s | Max: 34m 56s | Hits:  99%/727

🟩 thrust: Pass: 100%/122 | Total: 13h 20m | Avg: 6m 33s | Max: 26m 16s | Hits: 99%/20079

🟩 cpu
  🟩 amd64              Pass: 100%/114 | Total: 12h 44m | Avg:  6m 42s | Max: 26m 16s | Hits:  99%/20079 
  🟩 arm64              Pass: 100%/8   | Total: 36m 05s | Avg:  4m 30s | Max:  4m 49s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 09m | Avg:  4m 39s | Max: 15m 55s | Hits:  99%/2231  
  🟩 11.8               Pass: 100%/3   | Total: 13m 52s | Avg:  4m 37s | Max:  4m 56s
  🟩 12.6               Pass: 100%/104 | Total: 11h 56m | Avg:  6m 53s | Max: 26m 16s | Hits:  99%/17848 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 40s | Avg:  4m 20s | Max:  4m 25s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 09m | Avg:  4m 39s | Max: 15m 55s | Hits:  99%/2231  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 52s | Avg:  4m 37s | Max:  4m 56s
  🟩 nvcc12.6           Pass: 100%/102 | Total: 11h 48m | Avg:  6m 56s | Max: 26m 16s | Hits:  99%/17848 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 40s | Avg:  4m 20s | Max:  4m 25s
  🟩 nvcc               Pass: 100%/120 | Total: 13h 12m | Avg:  6m 36s | Max: 26m 16s | Hits:  99%/20079 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 29m 15s | Avg:  4m 52s | Max:  5m 44s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 33s | Avg:  5m 51s | Max:  6m 13s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 53s | Avg:  4m 28s | Max:  4m 45s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 30s | Avg:  4m 52s | Max:  5m 26s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 04s | Avg:  4m 31s | Max:  4m 41s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 19s | Avg:  4m 34s | Max:  4m 59s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 12s | Avg:  4m 48s | Max:  5m 08s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 44s | Avg:  4m 41s | Max:  4m 59s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 17s | Avg:  4m 49s | Max:  5m 23s
  🟩 Clang18            Pass: 100%/18  | Total:  2h 13m | Avg:  7m 26s | Max: 17m 02s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 27s | Avg:  3m 43s | Max:  3m 51s
  🟩 GCC7               Pass: 100%/6   | Total: 24m 13s | Avg:  4m 02s | Max:  4m 43s
  🟩 GCC8               Pass: 100%/6   | Total: 24m 50s | Avg:  4m 08s | Max:  4m 34s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 40s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 03s | Avg:  4m 30s | Max:  4m 44s
  🟩 GCC11              Pass: 100%/7   | Total: 32m 41s | Avg:  4m 40s | Max:  5m 00s
  🟩 GCC12              Pass: 100%/4   | Total: 19m 43s | Avg:  4m 55s | Max:  5m 24s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 49m | Avg:  8m 29s | Max: 26m 16s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 17m 18s | Avg:  5m 46s | Max:  6m 00s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 55s | Avg: 15m 55s | Max: 15m 55s | Hits:  99%/2231  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 26m 31s | Avg: 13m 15s | Max: 13m 18s | Hits:  99%/4462  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 48m | Avg: 18m 04s | Max: 20m 38s | Hits:  99%/13386 
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  5h 11m | Avg:  5m 39s | Max: 17m 02s
  🟩 GCC                Pass: 100%/55  | Total:  5h 21m | Avg:  5m 50s | Max: 26m 16s
  🟩 Intel              Pass: 100%/3   | Total: 17m 18s | Avg:  5m 46s | Max:  6m 00s
  🟩 MSVC               Pass: 100%/9   | Total:  2h 30m | Avg: 16m 45s | Max: 20m 38s | Hits:  99%/20079 
🟩 gpu
  🟩 v100               Pass: 100%/122 | Total: 13h 20m | Avg:  6m 33s | Max: 26m 16s | Hits:  99%/20079 
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  9h 08m | Avg:  5m 19s | Max: 18m 11s | Hits:  99%/13386 
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 59m | Avg: 10m 51s | Max: 20m 38s | Hits:  99%/6693  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 12m | Avg: 16m 33s | Max: 26m 16s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 52s | Avg:  4m 37s | Max:  4m 56s
  🟩 90a                Pass: 100%/4   | Total: 30m 09s | Avg:  7m 32s | Max: 18m 11s
🟩 std
  🟩 11                 Pass: 100%/31  | Total:  2h 53m | Avg:  5m 36s | Max: 18m 11s
  🟩 14                 Pass: 100%/35  | Total:  4h 03m | Avg:  6m 57s | Max: 26m 16s | Hits:  99%/8924  
  🟩 17                 Pass: 100%/34  | Total:  3h 50m | Avg:  6m 46s | Max: 20m 38s | Hits:  99%/6693  
  🟩 20                 Pass: 100%/22  | Total:  2h 33m | Avg:  6m 58s | Max: 20m 29s | Hits:  99%/4462

🟩 cudax: Pass: 100%/58 | Total: 2h 45m | Avg: 2m 51s | Max: 7m 26s | Hits: 59%/202

🟩 cpu
  🟩 amd64              Pass: 100%/54  | Total:  2h 36m | Avg:  2m 53s | Max:  7m 26s | Hits:  59%/202   
  🟩 arm64              Pass: 100%/4   | Total:  9m 49s | Avg:  2m 27s | Max:  2m 51s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 05m | Avg:  2m 51s | Max:  7m 10s | Hits:  59%/101   
  🟩 12.6               Pass: 100%/35  | Total:  1h 40m | Avg:  2m 51s | Max:  7m 26s | Hits:  59%/101   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 05m | Avg:  2m 51s | Max:  7m 10s | Hits:  59%/101   
  🟩 nvcc12.6           Pass: 100%/35  | Total:  1h 40m | Avg:  2m 51s | Max:  7m 26s | Hits:  59%/101   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/58  | Total:  2h 45m | Avg:  2m 51s | Max:  7m 26s | Hits:  59%/202   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  5m 01s | Avg:  2m 30s | Max:  2m 35s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 44s | Avg:  2m 22s | Max:  2m 30s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 31s | Avg:  2m 22s | Max:  2m 34s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 33s | Avg:  2m 23s | Max:  2m 32s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 23s | Avg:  2m 20s | Max:  2m 25s
  🟩 Clang14            Pass: 100%/6   | Total: 17m 32s | Avg:  2m 55s | Max:  4m 13s
  🟩 Clang15            Pass: 100%/2   | Total:  5m 01s | Avg:  2m 30s | Max:  2m 38s
  🟩 Clang16            Pass: 100%/4   | Total: 10m 11s | Avg:  2m 32s | Max:  2m 51s
  🟩 Clang17            Pass: 100%/2   | Total:  4m 56s | Avg:  2m 28s | Max:  2m 29s
  🟩 Clang18            Pass: 100%/4   | Total: 14m 52s | Avg:  3m 43s | Max:  5m 19s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 48s | Avg:  2m 24s | Max:  2m 38s
  🟩 GCC10              Pass: 100%/4   | Total:  9m 10s | Avg:  2m 17s | Max:  2m 31s
  🟩 GCC11              Pass: 100%/4   | Total:  9m 51s | Avg:  2m 27s | Max:  2m 47s
  🟩 GCC12              Pass: 100%/9   | Total: 29m 56s | Avg:  3m 19s | Max:  5m 11s
  🟩 GCC13              Pass: 100%/3   | Total:  6m 50s | Avg:  2m 16s | Max:  2m 23s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  7m 10s | Avg:  7m 10s | Max:  7m 10s | Hits:  59%/101   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 26s | Avg:  7m 26s | Max:  7m 26s | Hits:  59%/101   
🟩 cxx_family
  🟩 Clang              Pass: 100%/34  | Total:  1h 30m | Avg:  2m 40s | Max:  5m 19s
  🟩 GCC                Pass: 100%/22  | Total:  1h 00m | Avg:  2m 45s | Max:  5m 11s
  🟩 MSVC               Pass: 100%/2   | Total: 14m 36s | Avg:  7m 18s | Max:  7m 26s | Hits:  59%/202   
🟩 gpu
  🟩 v100               Pass: 100%/58  | Total:  2h 45m | Avg:  2m 51s | Max:  7m 26s | Hits:  59%/202   
🟩 jobs
  🟩 Build              Pass: 100%/50  | Total:  2h 09m | Avg:  2m 35s | Max:  7m 26s | Hits:  59%/202   
  🟩 Test               Pass: 100%/8   | Total: 36m 02s | Avg:  4m 30s | Max:  5m 19s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 11s | Avg:  2m 11s | Max:  2m 11s
  🟩 90a                Pass: 100%/1   | Total:  2m 09s | Avg:  2m 09s | Max:  2m 09s
🟩 std
  🟩 17                 Pass: 100%/32  | Total:  1h 24m | Avg:  2m 37s | Max:  4m 30s
  🟩 20                 Pass: 100%/26  | Total:  1h 21m | Avg:  3m 08s | Max:  7m 26s | Hits:  59%/202

🟩 cccl: Pass: 100%/4 | Total: 18m 32s | Avg: 4m 38s | Max: 5m 28s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  5m 28s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 44s | Avg:  4m 22s | Max:  5m 07s
  🟩 12.6               Pass: 100%/2   | Total:  9m 48s | Avg:  4m 54s | Max:  5m 28s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 44s | Avg:  4m 22s | Max:  5m 07s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 48s | Avg:  4m 54s | Max:  5m 28s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  5m 28s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  5m 07s | Avg:  5m 07s | Max:  5m 07s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 37s | Avg:  3m 37s | Max:  3m 37s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total: 10m 35s | Avg:  5m 17s | Max:  5m 28s
  🟩 GCC                Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 20s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  5m 28s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  5m 28s

🟩 pycuda: Pass: 100%/1 | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 17m 40s | Avg: 17m 40s | Max: 17m 40s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 437)

#	Runner
320	`linux-amd64-cpu16`
66	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

wmaxey added 13 commits August 16, 2024 13:17

Support fetch_add and CAS on 8/16b

9941a44

Add 16b test

bfd97ee

Fix issues found when enabling 8/16b in a heterogeneous test, PTX see…

24bb639

…ms to be invalid though

Remove 16b cas and use only 32b cas.

f93e690

Get several tests passing for 8/16b atomics

ae24c8e

Remove todo and ifdefs from tests covering 8b/16b atomics

1af8667

Fix bug in 16b atomic load

ff06fa1

Move store close to fetch_update since it is a derived primitive

8daaad1

Fix bug in minmax due to s64 overload missing for arithmetic types

f588332

Add more 8/16b tests for atomic_ref

60e8c25

Fixup remove debug prints

e9a79f4

Cleanup bitmask hell, fix bug where lower mask was ignored

b713109

Add test covering interleaved CAS onto same atomic window

1c2627d

wmaxey requested review from a team as code owners August 17, 2024 00:11

wmaxey requested review from alliepiper, gonidelis and griwes August 17, 2024 00:11

Fixup documentation mistake.

c0f52c8

miscco reviewed Aug 17, 2024

View reviewed changes

libcudacxx/codegen/generators/compare_and_swap.h Show resolved Hide resolved

miscco reviewed Aug 19, 2024

View reviewed changes

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Outdated Show resolved Hide resolved

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Show resolved Hide resolved

Make atomics enable_if uses match rest of libcudacxx.

6d1beec

jrhemstad requested a review from gonzalobg August 19, 2024 21:49

Verify fetch_add sequential load behavior in 8b/16b atomics

d5f8928

gonzalobg reviewed Aug 20, 2024

View reviewed changes

libcudacxx/test/atomic_codegen/atomic_add_16b.cu Outdated Show resolved Hide resolved

wmaxey added 2 commits August 20, 2024 12:59

Remove 8b/16b add PTX tests

c9ca506

Optimize fetch_update CAS loops

6f5d0b8

Fix name of preset for PTX codegen test

b7b944e

wmaxey added 4 commits August 21, 2024 09:29

Fix signed/unsigned comparison

2381c42

Fix atomics codegen tests not being built

07d1077

Fix CMake target for libcudacxx ptx tests.

a2d19d1

Make dump_and_check executable again

70aa4a3

jrhemstad requested a review from gonzalobg August 28, 2024 17:17

gonzalobg reviewed Aug 28, 2024

View reviewed changes

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Show resolved Hide resolved

gonzalobg reviewed Aug 28, 2024

View reviewed changes

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Outdated Show resolved Hide resolved

gonzalobg reviewed Aug 28, 2024

View reviewed changes

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Show resolved Hide resolved

Work around inconsistent parsing of [[[ in FileCheck versions

e08ed80

jrhemstad requested review from gonzalobg and miscco September 4, 2024 17:04

wmaxey added 2 commits September 4, 2024 10:12

Make min/max match algorith.min/max.

1000597

Merge branch 'main' into fea/atomic_ref_8_16_bit_support

f48a49b

gonzalobg reviewed Sep 11, 2024

View reviewed changes

libcudacxx/include/cuda/std/__atomic/functions/cuda_ptx_derived.h Outdated Show resolved Hide resolved

wmaxey added 4 commits September 11, 2024 13:16

Work around NVCC 11.X using different syntax for inline ptx

b7baeef

Fix warnings in the codegen tests.

c59b3ab

Use PTX 16b ld/st instead of 32b CAS

642b487

Switch 8b ld/st to 16b ld

b1901a2

wmaxey requested a review from gonzalobg September 11, 2024 21:52

Add atomic_ref support for 8 and 16b types. #2255

Are you sure you want to change the base?

Add atomic_ref support for 8 and 16b types. #2255

Conversation

wmaxey commented Aug 17, 2024

Description

Checklist

github-actions bot commented Aug 17, 2024

🟩 cub: Pass: 100%/131 | Total: 1d 04h | Avg: 12m 54s | Max: 1h 16m | Hits: 98%/4278

🟩 thrust: Pass: 100%/118 | Total: 13h 17m | Avg: 6m 45s | Max: 35m 45s | Hits: 97%/13005

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 12h | Avg: 19m 34s | Max: 43m 46s | Hits: 61%/16707

🟩 cudax: Pass: 100%/55 | Total: 2h 36m | Avg: 2m 50s | Max: 6m 58s | Hits: 82%/102

🟩 pycuda: Pass: 100%/1 | Total: 11m 49s | Avg: 11m 49s | Max: 11m 49s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 417)

github-actions bot commented Aug 20, 2024

🟨 thrust: Pass: 97%/118 | Total: 12h 20m | Avg: 6m 16s | Max: 35m 08s | Hits: 99%/13005

🟨 libcudacxx: Pass: 97%/112 | Total: 1d 06h | Avg: 16m 22s | Max: 43m 42s | Hits: 96%/16707

🟨 cub: Pass: 99%/131 | Total: 18h 25m | Avg: 8m 26s | Max: 31m 37s | Hits: 99%/4278

🟩 cudax: Pass: 100%/55 | Total: 2h 34m | Avg: 2m 49s | Max: 8m 32s | Hits: 72%/102

🟩 pycuda: Pass: 100%/1 | Total: 12m 06s | Avg: 12m 06s | Max: 12m 06s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 417)

github-actions bot commented Aug 21, 2024

🟨 cub: Pass: 98%/131 | Total: 19h 28m | Avg: 8m 55s | Max: 1h 12m | Hits: 99%/4278

🟨 libcudacxx: Pass: 98%/112 | Total: 1d 03h | Avg: 14m 44s | Max: 25m 42s | Hits: 98%/16707

🟩 thrust: Pass: 100%/118 | Total: 12h 26m | Avg: 6m 19s | Max: 33m 47s | Hits: 99%/13005

🟩 cudax: Pass: 100%/55 | Total: 2h 34m | Avg: 2m 49s | Max: 9m 28s | Hits: 72%/102

🟩 cccl: Pass: 100%/4 | Total: 18m 04s | Avg: 4m 31s | Max: 5m 05s

🟩 pycuda: Pass: 100%/1 | Total: 11m 08s | Avg: 11m 08s | Max: 11m 08s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 421)

github-actions bot commented Aug 28, 2024

🟨 libcudacxx: Pass: 79%/112 | Total: 17h 31m | Avg: 9m 23s | Max: 41m 39s | Hits: 90%/16707

🟩 cub: Pass: 100%/131 | Total: 20h 32m | Avg: 9m 24s | Max: 53m 08s | Hits: 99%/4278

🟩 thrust: Pass: 100%/118 | Total: 13h 13m | Avg: 6m 43s | Max: 40m 03s | Hits: 99%/13005

🟩 cudax: Pass: 100%/55 | Total: 2h 21m | Avg: 2m 33s | Max: 8m 57s | Hits: 82%/102

🟩 cccl: Pass: 100%/4 | Total: 17m 55s | Avg: 4m 28s | Max: 4m 55s

🟩 pycuda: Pass: 100%/1 | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 421)

github-actions bot commented Aug 29, 2024

🟨 libcudacxx: Pass: 94%/112 | Total: 17h 12m | Avg: 9m 13s | Max: 37m 35s | Hits: 98%/16707

🟨 cub: Pass: 99%/131 | Total: 21h 53m | Avg: 10m 01s | Max: 51m 08s | Hits: 99%/4278

🟩 thrust: Pass: 100%/118 | Total: 13h 13m | Avg: 6m 43s | Max: 56m 07s | Hits: 99%/13005

🟩 cudax: Pass: 100%/55 | Total: 2h 26m | Avg: 2m 39s | Max: 10m 02s | Hits: 80%/102

🟩 cccl: Pass: 100%/4 | Total: 17m 27s | Avg: 4m 21s | Max: 4m 31s

🟩 pycuda: Pass: 100%/1 | Total: 12m 01s | Avg: 12m 01s | Max: 12m 01s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 421)

github-actions bot commented Sep 11, 2024

🟨 libcudacxx: Pass: 83%/116 | Total: 1d 09h | Avg: 17m 09s | Max: 59m 39s | Hits: 95%/16941

🟩 cub: Pass: 100%/136 | Total: 20h 41m | Avg: 9m 07s | Max: 43m 24s | Hits: 99%/4362

🟩 thrust: Pass: 100%/122 | Total: 13h 12m | Avg: 6m 29s | Max: 21m 48s | Hits: 99%/20079

🟩 cudax: Pass: 100%/58 | Total: 2h 49m | Avg: 2m 54s | Max: 8m 28s | Hits: 56%/202

🟩 cccl: Pass: 100%/4 | Total: 17m 21s | Avg: 4m 20s | Max: 4m 57s

🟩 pycuda: Pass: 100%/1 | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 437)

gonzalobg Sep 11, 2024

Choose a reason for hiding this comment

miscco Sep 16, 2024

Choose a reason for hiding this comment

gonzalobg Sep 11, 2024

Choose a reason for hiding this comment

wmaxey Sep 11, 2024

Choose a reason for hiding this comment

wmaxey Sep 11, 2024

Add `atomic_ref` support for 8 and 16b types. #2255

Add `atomic_ref` support for 8 and 16b types. #2255

gonzalobg Sep 16, 2024 •

edited

Loading